سخت افزار

رونمایی AMD از خانواده شتاب دهنده Instinct MI200

شرکت AMD امروز اولین معماری 6 نانومتری CDNA2 (Compute-DNA) خود را در قالب خانواده Instinct MI200 معرفی کرد. شتاب‌دهنده چیپ‌لت‌های جدید با GPU دوگانه قصد دارد AMD را به دوره جدیدی از برنامه‌های محاسباتی با عملکرد بالا (HPC) سوق دهد، منطقه‌ای که برای رقابت برای رشد مداوم و پایدار به آن نیاز دارد.

برای این منظور، AMD در معماری بالغ و محاسباتی که با Graphics Core Next (GCN) متولد شده بود، بهبود بیشتری داده – و توانسته عملکرد را بهبود بخشد و در عین حال اندازه کل قالب را در مقایسه با خانواده MI100 خود کاهش دهد. شتاب دهنده MI250X AMD دارای دو قالب محاسباتی با 58 میلیارد ترانزیستور ساخته شده از فرآیند 6 نانومتری TSMC است. هر یک از این تراشه ها مجموعاً دارای 110 واحد محاسباتی (CU) برای مجموع 220 واحد CU در یک شتاب دهنده واحد هستند.

معماری جدید CDNA2 همچنین دارای هسته های جدید و بهبود یافته Matrix به میزان 880 واحد (440 در هر تراشه) است. همانطور که MI250X پیکربندی شده، این مقدار باورنکردنی از قدرت GPU با 128 گیگابایت حافظه HBM2E جفت می شود که با سرعت 3.2 گیگابایت بر ثانیه کار می کند. تخمین‌های عملکرد AMD در برابر نسل فعلی A100 NVIDIA، شکست‌هایی هستند. در مقایسه با A100، MI250X به شرح زیر است: 4.9 برابر سریعتر در محاسبه برداری FP64؛ حدود 2.5 برابر سریعتر در FP 32 وکتور؛ 4.9 برابر سریعتر در ماتریس FP64؛ عملکرد ناچیزتر 1.2 برابر سریعتر در عملیات ماتریس FP16 و BF16؛ ظرفیت حافظه 1.6 برابر بیشتر (128 گیگابایت در MI 250X در مقایسه با 80 گیگابایت A100). و پهنای باند حافظه 1.6 برابر سریعتر.

دو قالب CDNA2 به AMD Infinity Fabric متصل شده‌اند که برای اولین بار در معماری گرافیکی ظاهر می‌شود. این پیوند مجموعه ای از لینک های 25 گیگابیت بر ثانیه را ارائه می دهد که حداکثر 100 گیگابایت بر ثانیه پهنای باند دو طرفه را بین هر دو GPU ارائه می دهد. هشت لینک در دسترس در ماژول توزیع MI200 وجود دارد که براساس مشخصات یک OAM (ماژول شتاب دهنده OCP، که در آن OCP مخفف “پلتفرم محاسبات باز”) ساخته شده است.

در مجموع 800 گیگابایت بر ثانیه پهنای باند برای ارتباط مستقیم بین دو چیپلت در دسترس است. AMD قبلاً اعلام کرده بود که یک نسخه PCIe از MI200 در آینده راه اندازی شده و برای کسانی که فقط خواهان جایگزینی یا ارتقاء هستند، عرضه می شود. استفاده AMD از فناوری ساخت N6 TSMC مطمئناً می تواند بخشی از عملکرد و بهبود اندازه قالب را به همراه داشته باشد. همانطور که هر سازنده ای انجام می دهد، AMD تلاش های بهینه سازی بازده را به کار می گیرد. در مجموع، سری MI200 یک پیشرفت قابل توجه برای عملکرد AMD است. با این حال، NVIDIA مطمئناً به زودی راه حل محاسباتی نسل بعدی خود را معرفی خواهد کرد.

منبع
techpowerup
نمایش بیشتر

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا