AMD اولین پردازشگر گرافیکی دنیا با فناوری ماژول مولتی-چیپ (MCM) را معرفی کرد. این پردازشگر گرافیکی فوق قدرتمند که Instinct MI200 نام دارد، از معماری CDNA 2 بهره میبرد و با لیتوگرافی ۶ نانومتری تولید میشود.
این GPU با اسم رمز «Aldebaran» در ابعاد و فرمهای مختلفی وارد بازار میشود که از ویژگیهای مشترکی به شرح زیر بهره میبرند:
- معماری AMD CDNA 2: نسل دوم هستههای ماتریس شتابدهنده عملیاتهای ماتریس FP32 و FP64 که از نظر تئوری تا ۴ برابر حداکثر عملکرد FP64 بالاتری نسبت به نسلهای قبلی پردازشگرهای گرافیکی AMD دارند.
- فناوری بستهبندی پیشرفته: اولین پردازشگر گرافیکی مولتی دای (Die) جهان با فناوری 2.5D EFB که تعداد هستهها را ۱.۸ برابر و پهنای باند حافظه را ۲.۷ برابر نسبت به نسلهای قبلی GPUهای AMD افزایش میدهد. این پردازشگر گرافیکی در حالت تئوری از بالاترین پهنای باند بهره میبرد که برابر ۳.۲ ترابایت بر ثانیه است.
- نسل سوم فناوری Infinity Fabric AMD: تا ۸ اتصال Infinity Fabric با نسل سوم پردازندههای EPYC و سایر GPUها که امکان دستیابی به معماری یکپارچه CPU/GPU را فراهم میکند.
درون Instinct MI200 یک پردازشگر گرافیکی Aldebaran قرار گرفته که شامل دو دای میشود و هرکدام از ۸ موتور سایهزن بهره میبرد. هر موتور شامل ۱۶ CU و نسل دوم موتور ماتریس برای عملیاتهای FP16 و BF16 میشود.
هر دای حاوی ۱۲۸ واحد اجرایی یا ۸۱۹۲ پردازنده جریانی است. در مجموع با ۲۲۰ واحد اجرایی یا ۱۴,۰۸۰ پردازنده جریانی روبهرو هستیم. هر چیپلت همچنین از موتور VCN 2.6 و کنترلر اصلی ورودی/خروجی بهره میبرد.
در بخش DRAM با یک رابط ۸ کاناله با رابطهای ۱۰۲۴ بیتی برای یک رابط باس ۸۱۹۲ بیتی روبهرو هستیم. هر رابط میتواند از ماژولهای DRAM با ظرفیت ۲ گیگابایت HBM2e پشتیبانی کند که ظرفیت حافظه هر پشته را به ۱۶ گیگابایت HBM2e میرساند. از آنجایی که با ۸ پشته روبهرو هستیم، در مجموعه با ظرفیت ۱۲۸ گیگابایت روبهرو هستیم که ۴۸ گیگابایت از انویدیا A100 با ۸۰ گیگابایت حافظه HBM2e بیشتر است.
پهنای باند مموری به ۳.۲ ترابایت بر ثانیه میرسد که ۱.۲ ترابایت از A100 هشتاد گیگابایتی بیشتر است. انتظار میرود انویدیا سال آینده میلادی از اولین پردازشگر گرافیکیاش با فناوری MCM رونمایی کند تا شاهد رقابت سنگینی میان آن و AMD باشیم.
پردازشگر گرافیکی Instinct MI200 قدرت سه سوپر کامپیوتر دنیا شامل سیستم «Frontier» ایالات متحده را تامین خواهد کرد. این GPU در سه پیکربندی از راه میشود که شامل MI250 و MI250X به همراه مدل MI210 با اسلات دوگانه PCIe میشود. مدل MI250 از ۱۳,۳۱۲ هسته بهره میبرد و در FP64/FP32/FP16 به ترتیب ۴۵.۳، ۹۰.۵ و ۳۶۲.۱ ترافلاپس قدرت دارد.
مدل دیگر یعنی MI250X از ۱۴,۰۸۰ هسته بهره میبرد و در FP64/FP32/FP16 به ترتیب قدرتی برابر ۴۷.۹، ۹۵.۷ و ۳۸۳ ترافلاپس دارد. پیکربندی حافظه میان این دو پیکربندی پردازشگر گرافیکی AMD یکسان است.