آیا میدانید کارت گرافیک از چه بخشهایی تشکیل شده است یا بخشهای مختلف آن چگونه با هم کار میکنند و وظیفه هر کدام از آنها چیست؟ در ادامه به این سؤالات پاسخ میدهیم و ساختار این قطعه تحسینبرانگیز کامپیوتر را موشکافانه کالبدشکافی میکنیم.
کارت گرافیک قطعه گرانقیمتی محسوب میشود که از میلیاردها ترانزیستور تشکیل شده است و مصرف بالایی هم دارد. این بخش از کامپیوتر یک شاهکار مهندسی الکترونیکی است.
کارت گرافیک یا به بیان دیگر کارت توسعه شتابدهنده ویدیو در انواع مختلف و در ردههای قیمتی مختلف تولید میشود و از ۵۳ دلار تا ۱۲۰۰ دلار به فروش میرسد. در این مطلب قصد داریم آناتومی کارت گرافیک را بهصورت ساده و خلاصه تشریح کنیم.
نگاه کلی به کارت گرافیک
کارتهای گرافیک از تراشههای سیلیکونی نصبشده رو بردها برای انجام وظایفی مثل ایجاد گرافیک دوبعدی و سهبعدی رمزگذاری و رمزگشایی (انکد و دیکد) سیگنالهای ویدیویی استفاده میکنند. در این مطلب قصد داریم کارت گرافیک نسبتاً قدیمی AMD Radeon HD 6870 را که در سال ۲۰۱۰ عرضه شده، بررسی کنیم.
در نگاه اول به ساختار این کارت گرافیک چیز زیادی متوجه نمیشویم. ظاهراً بخشهای زیادی از این کارت گرافیک ۲۲ سانتیمتری از پلاستیک تشکیل شده است. از دیگر بخشهای کاملاً مشخص در این تصویر میتوان به یک براکت فلزی که کارت گرافیک را محکم روی مادربرد نگه میدارد، یک فن قرمزرنگ و یک کانکتور برد مدار اشاره کرد. وقتیکه کارت گرافیک را برمیگردانیم قطعاتی را میبینیم که در تصویر زیر نمایش داده شدهاند.
اولین چیزی که پس از برگرداندن کارت گرافیک نظر شما را به خود جلب میکند، یک براکت فلزی دیگر است که تمام قطعات را در خود نگه داشته است. در سایر قسمتهای برد مدار، قطعه دیگری دیده نمیشود؛ اما میتوانیم سیمهای زیادی را که از قسمت میانی برد به سایر بخشها متصل شدهاند، بهراحتی مشاهده کنیم؛ بنابراین این قسمت از برد باید مهم و کاملاً پیچیده باشد.
تمام تراشههای موجود روی کارت گرافیک جزو تراشههای مجتمع محسوب میشوند و دمای آنها در هنگام فعالیت افزایش مییابد. تعداد تراشههای مجتمع کارتهای گرافیک بسیار زیاد است و تمام آنها در فضای بسیار کمی در کنار یکدیگر قرار گرفتهاند. درنتیجه تمام کارتهای گرافیک دارای سیستم خنککننده هستند و کارت گرافیکی که در حال بررسی آن هستیم، نیز از این قاعده مستثنا نیست.
آناتومی سیستم خنککننده کارت گرافیک
معمولاً در بسیاری از کارتهای گرافیک از سیستم خنککننده دمنده (blower) استفاده میشود. در این سیستم هوای داخل کیس مکش میشود و قبل از اینکه به بیرون کیس منتقل شود، از روی قطعه فلزی بزرگی عبور میکند. در تصویر بالا یک بلوک فلزی را مشاهده میکنید و مواد چسبیده شده به آن باقیمانده مادهای به نام چسب حرارتی (thermal paste) است. این ماده فاصله بین ریزتراشههای پردازنده گرافیکی یا GPU و بلوک فلزی را پر میکند؛ بنابراین گرما بهتر منتقل میشود.
در تصویر بالا نوار سه نوار آبیرنگ را نیز مشاهده میکنید که پدهای حرارتی (thermal pads) نام دارند. این نوارها مواد نرمی هستند که بهمنظور ایجاد ارتباط بهتر بین برخی از قسمتهای برد مدار و پایه خنککننده (که آن هم فلزی است)، روی کارت گرافیک قرار داده شدهاند. در صورت عدم وجود این نوارها، قطعات مختلف روی برد مدار بهسختی با صفحه فلزی تماس پیدا میکردند (یا حتی ممکن بود اصلاً تماس پیدا نکنند) و درنتیجه خنک نمیشدند.
اجازه دهید نگاه نزدیکتری به بخش اصلی این صفحه فلزی داشته باشیم. این صفحه در کارت گرافیکی که در حال بررسی آن هستیم، از فلز مس ساخته شده و چند لوله مسی هم از آن خارج و وارد چند پره آلومینیومی شدهاند. کل این مجموعه قطعات، هیت سینک نام دارند.
این لولههای مسی توخالی هستند و هر دو طرف آنها کاملاً بسته و مسدود شده است. در داخل این لولهها مقدار کمی آب (در برخی از مدلها مقداری آمونیاک) وجود دارد که گرما را از بلوک مسی جذب میکنند. دمای آب داخل این لولهها بهقدری افزایش مییابد که باعث بخار شدن آن میشود و به این صورت بخار آب از سمت منبع گرما یعنی بلوک مسی به سمت دیگر لولهها منتقل میشود.
بخار آب گرما را به سمت پرههای آلومینیومی منتقل میکند و پس از آن دوباره مایع میشود و فرایند مذکور بهصورت دوباره بهصورت مستمر تکرار میشود. قسمت داخلی لولههای مسی سطح سفتی دارند که باعث ایجاد پدیده فیزیکی مویینگی یا چسبندگی سطحی میشود (پدیده مویینگی زمانی رخ میدهد که مایع به سطحی بچسبد و از آن عبور کند) که بر اثر آن، بخار آبی که دوباره به مایع تبدیل شده است، به سطح داخلی لوله میچسبد تا دوباره به صفحه مسی بازگردد.
البته لولههای حرارتی (معمولاً با این نام نامیده میشوند) در هر کارت گرافیکی وجود ندارند؛ زیرا دمای کارت گرافیکهای اقتصادی و ارزانقیمت چندان افزایش پیدا نمیکند؛ بنابراین این دسته از کارتهای گرافیک نیازی به لولههای حرارتی ندارند. در ضمن همانطور که در تصویر زیر میبینید در این کارتهای گرافیک برای کاهش هزینه در داخل هیت سینک از صفحه مسی نیز استفاده نمیشود.
کارت گرافیک ایسوس GeForce GT 710 یکی از کارتهای گرافیک اقتصادی و ردهپایین بازار محسوب میشود. مصرف این دسته از کارتهای گرافیک بهندرت بیشتر از ۲۰ وات میشود؛ بنابراین آنها جریان زیادی مصرف نمیکنند و بیشتر جریان مصرفی آنها به گرما تبدیل میشود؛ البته گرمای ایجادشده بر اثر فعالیت این گروه از کارتهای گرافیک بهاندازهای نیست که عملکرد آنها را مختل کند؛ بنابراین نیازی به سیستم خنککننده بسیار قوی ندارند.
یکی از مشکلات مرتبط با سیستمهای خنککننده دمنده این است که فن مورداستفاده در سیستم برای خارج کردن هوای فشرده از پرههای آلومینیومی و درنهایت کیس کامپیوتر، کار سختی را بر عهده دارد و باید با تمام توان و با سرعت بالا کار کند (معمولاً عرض فن بیشتر از عرض خود کارت گرافیک نیست) که موجب ایجاد سروصدای زیادی میشود.
راهحل متداول برای حل این مشکل، استفاده از سیستم خنککننده باز است. در این نوع سیستم فن تنها جریان هوا را به سمت پرههای آلومینیومی هدایت میکند و قسمتهای فلزی یا پلاستیکی اطراف فن جریان هوای داغ را به بیرون از کیس کامپیوتر هدایت میکنند. یکی از مزایای اصلی سیستم خنککننده باز نسبت به نوع بسته آن، امکان استفاده از فن بزرگتر است که به دلیل اینکه با سرعت کمتری میچرخد، صدای کمتری هم دارد؛ بنابراین کارت گرافیکهای دارای سیستم خنککننده باز صدای کمتری ایجاد میکنند؛ البته کارت گرافیکهای دارای این سیستم نسبت به کارت گرافیکهای مجهز به سیستم خنککننده بسته، بزرگتر هستند که باعث میشود دمای کامپیوتر در حین کار بیشتر افزایش یابد.
لازم به توضیح است سیستمهای خنککننده مایع نسبت به سیستمهای خنککننده دمنده عملکرد بسیار بهتری دارند و قبل از اینکه دمای کارت گرافیک افزایش یابد، بهخوبی گرما را دفع میکنند (راندمان سیستمهای خنککننده مایع در جلوگیری از افزایش دما چهار برابر بیشتر از سیستمهای خنککننده دمنده است).
خوشبختانه نصب سیستمهای خنککننده مایع روی برخی از کارتهای گرافیک فاقد این سیستم امکانپذیر است. یادآوری میکنیم که کارتهای گرافیکی که در کارخانه مجهز به این سیستم خنککننده میشوند، قیمت بسیار بالایی دارند.
تصویر بالا متعلق به کارت گرافیک ئیویجیای GeForce RTX 2080 Ti KiNGPiN GAMING است که سیستم خنککننده دمنده آن تنها برای خنک کردن رم و سایر قطعات برد استفاده میشود و تراشه پردازنده اصلی با سیستم خنککننده مایع خنک میشود. قیمت این کارت گرافیک ۱۸۰۰ دلار است!
حداکثر مصرف اولین کارت گرافیک ۲۵۰ وات است که برای یک کارت گرافیک، مصرف بسیار بالایی محسوب میشود؛ اما از مصرف کارت گرافیک RX 5700 XT که قبلاً با آن آشنا شدیم، کمتر است.
برای استفاده از کارت گرافیک جهت انجام کارهای روزمره، نیازی به نصب و استفاده از سیستمهای خنککننده مایع ندارید و تنها زمانی که میخواهید ولتاژ کارت گرافیک یا سرعت کلاک آن را به میزان بسیار زیادی افزایش دهید، باید به سراغ چنین سیستمهای خنککننده قدرتمندی بروید؛ زیرا در چنین مواردی دمای کارت گرافیک به معنای واقعی کلمه افزایش مییابد.
آناتومی پردازنده گرافیکی کارت گرافیک
اکنونکه با سیستم خنککننده کارتهای گرافیک آشنا شدیم، اجازه دهید کالبدشکافی ساختار اصلی آن را آغاز کنیم. پردازنده گرافیکی درواقع مغز کارت گرافیک محسوب میشود. در تصویر زیر پردازنده گرافیکی همان تراشه سیاهرنگی است که در مرکز برد دیده میشود و با تراشههای سیاهرنگ کوچکتر و همچنین تعداد بسیار زیادی از قطعات الکترونیکی دیگر احاطه شده است.
چنین ساختاری در هر کارت گرافیکی دیده میشود و تمام کارت گرافیکها دارای قطعات مشابه و چیدمان مشابهی هستند. حتی در کارتهای گرافیک متعلق به سال ۱۹۹۸ با فناوریهای متعلق به شرکت ATI Technologies نیز شاهد چنین ساختاری هستیم.
پس از باز کردن کارت گرافیک HD 6870 تراشه بزرگی را به همراه رم و تعدادی از قطعات الکترونیکی که آن را راهاندازی میکنند، مشاهده میکنیم. این پردازنده بزرگ نامهای متفاوتی دارد که از میان آنها میتوان به آداپتور ویدیویی، شتابدهنده دوبعدی/ سهبعدی یا تراشه گرافیکی اشاره کرد؛ اما امروزه این تراشه بزرگ، واحد پردازش گرافیکی یا بهاختصار GPU نام دارد. کلمه GPU چندین دهه است که استفاده میشود؛ اما انویدیا ادعا میکند که این کلمه نخستین بار توسط این شرکت استفاده شده است؛ امروزه تمام واحدهای پردازش گرافیکی ساختار نسبتاً یکسانی دارند. در تصویر زیر میتوانید نمایی از ساختار آنها را مشاهده کنید.
پردازندهای که در تصویر بالا مشاهده میکنید توسط AMD طراحی شده و شرکت TSMC آن را ساخته است. این پردازنده گرافیکی دارای کدنامهایی مثل TeraScale 2 برای معماری کلی و Barts XT برای نوع تراشه است. در این تراشه یک میلیارد و ۷۰۰ میلیون ترانزیستور وجود دارد که در فضایی بهاندازه ۲۵۵ میلیمتر مربع قرار گرفتهاند.
تعداد بسیار زیادی از سوئیچهای الکترونیکی، مدارهای مجتمع با کاربرد خاص (Application-specific integrated circuit) یا ASICs موجود در GPU را تشکیل میدهند. برخی از آنها تنها عملیات ریاضی ساده مثل ضرب یا جمع دو عدد را انجام میدهند. برخی دیگر مقادیر ذخیرهشده در حافظه را میخوانند و آنها را به سیگنالهای دیجیتال برای مانیتور کامپیوتر تبدیل میکنند.
واحدهای پردازش گرافیکی فعالیتهای زیادی را بهصورت همزمان انجام میدهند؛ بنابراین بخش عمدهای از ساختار آنها از بلوکهای یکسان واحدهای منطقی تشکیل شده است. در تصویر زیر میتوانید تصویر واحدهای پردازش گرافیکی Navi فعلی و کارتهای گرافیک AMD را بهوضوح مشاهده کنید.
در تصویر بالا میبینید که ۲۰ الگوی کاملاً یکسان کپی شدهاند و در کنار یکدیگر قرار گرفتهاند. این واحدهای پردازشی، واحدهای محاسباتی اصلی در تراشه هستند و عمده فعالیتهای مربوط به پردازش گرافیک سهبعدی بازیها را بر عهده دارند.
بخش زیادی از نواری که تقریباً در وسط تصویر دیده میشود، مربوط به حافظه کش تراشه است. حافظه کش حافظهای داخلی برای ذخیرهسازی دستورالعملها و دادهها محسوب میشود.
در لبه بالا و پایین تراشه مدارهای مجتمع با کاربرد خاص را میبینید که ارتباطات با تراشههای رم موجود روی کارت را مدیریت میکنند. در قسمت راست تراشه هم مدارهایی را میبینید که برای برقراری ارتباط با سایر قطعات کامپیوتر و رمزگذاری یا رمزگشایی سیگنالهای ویدیویی استفاده میشوند.
در کامپیوترهای دسکتاپ تمام پردازندههای گرافیکی روی برد مدار قرار نمیگیرند. معمولاً کامپیوترهای دسکتاپ و لپتاپهای ارزانقیمت و اقتصادی دارای کارت گرافیک مجزا نیستند و سیپییوی آنها مجهز به پردازنده گرافیکی داخلی است. تصویر زیر تصویر مطبوعاتی اینتل از سیپییوی Core i7-9900K این شرکت است.
همانطور که میبینید در این تصویر بخشهای مختلف با رنگهای مختلف از یکدیگر متمایز شدهاند تا تشخیص آنها راحتتر شود. قسمت آبیرنگ سمت چپ تصویر مربوط به پردازنده گرافیکی ادغامشده در سیپییو (پردازنده گرافیکی مجتمع) است. همانطور که میبینید این قسمت تقریباً یکسوم از فضای سیپییو را اشغال کرده است؛ اما به دلیل اینکه اینتل هرگز تعداد ترانزیستورهای مورداستفاده در تراشههای خود را رسانهای نمیکند. مشخص کردن میزان بزرگی پردازنده گرافیکی در این سیپییو دشوار است.
در جدول زیر بزرگترین و کوچکترین پردازندههای گرافیکی ساختهشده توسط AMD، اینتل و انویدیا در جدیدترین معماریهای این شرکتها با یکدیگر مقایسه شدهاند.
سازنده | AMD | اینتل | انویدیا |
معماری | RNDA | Gen 9.5 | Turing |
تراشه/ مدل | NAVI 10/ NaVI14 | GT3e/ GT1 | Tu102/Tu117 |
تعداد ترانزیستورها (میلیارد) | 6.4 10.3 | - - | 18.6 4.7 |
اندازه دای (میلیمتر مربع) | 251 158 | در حدود ۸۰ ۳۰ یا همین حدود | ۷۵۴ ۲۰۰ |
پردازندههای گرافیکی ناوی که بر پایه معماری ۷ نانومتری ساخته شدهاند با معماری ۱۴ نانومتری اختصاصی اینتل و همچنین با معماری اصلاحشده ۱۶ نانومتری TMSC که برای کارتهای گرافیک انویدیا ارائه شده و TMSC آن را معماری 12FFN نامیده است، مقایسه شده است؛ بنابراین امکان مقایسه مستقیم این معماریهای مختلف وجود ندارد؛ اما در مورد یک موضوع میتوانیم با قاطعیت سخن بگوییم و آن هم وجود تعداد بسیار زیادی از ترانزیستورها در پردازندههای گرافیکی است.
اجازه دهید ببینیم تعداد ترانزیستورهای مورداستفاده در پردازندههای گرافیکی از ابتدای پیدایش این پردازندهها تاکنون، چه روندی داشته است.
در پردازنده ICC که ۲۱ سال قبل ساخته شده است وقبلا با آن آشنا شدیم، پنج میلیون ترانزیستور در فضایی بهاندازه ۳۹ میلیمتر مربع که در حقیقت اندازه دای تراشه است، وجود دارد. تعداد ترانزیستورهای موجود در کوچکترین تراشه ناوی AMD به میزان ۱۲۸۰ برابر، بیشتر است و در فضایی قرار گرفتهاند که نسبت به فضای موجود برای ترانزیستورهای پردازنده ICC تنها ۴ برابر بیشتر است. چنین پیشرفت شگفتانگیزی تنها در طول دو دهه حاصل شده است.
آناتومی حافظه کارت گرافیک
کارتهای گرافیک دارای تعداد زیادی تراشه حافظه هستند که برای ذخیرهسازی دادههای موردنیاز برای تشکیل تصاویر بازیها مورداستفاده قرار میگیرند و تقریباً تمام حافظههای مورداستفاده برای ذخیره چنین دادههایی از نوع DRAM هستند که به صورت اختصاصی برای کارتهای گرافیک طراحی شدهاند.
این حافظهها در ابتدای ورود خود به بازار، DDR SGRAM (double data rate synchronous graphics random access memory) یا حافظه پویای همزمان با نرخ داده دو برابر نامیده شدند و امروزه با نام اختصاری GDDR شناخته میشوند.
تراشهای که در حال بررسی آن هستیم دارای ۸ ماژول Hynix H5GQ1H23AFR GDDR5 SDRAM با فرکانس ۱.۰۵ گیگاهرتز است. این نوع حافظه هنوز هم در بسیاری از کارتهای گرافیک استفاده میشود؛ البته سازندگان بسیاری از کارتهای گرافیک امروزی در حال حرکت به سمت استفاده از حافظههای DDR6 هستند. DDR5 و DDR6 عملکرد مشابهی دارند.
آنها دارای یک کلاک پایه (کلاک پایهای که قبلاً ذکر شد) که برای زمانبندی صدور دستورالعملها و انتقال دادهها مورداستفاده قرار میگیرد. سیستم مجزایی برای انتقال دادهها از ماژولهای حافظه و دریافت دادهها از آنها استفاده میشود و این عملیات بهعنوان یک انتقال بلوک در فضای داخلی صورت میپذیرد. در حافظههای GDDR5 تعداد بیتهای پردازششده برای هر بار دسترسی به اطلاعاتت برای خواندن یا نوشتن آنها به ۲۵۶ (۸x۳۲) میرسد درحالیکه در حافظههای GDDR6 این تعداد دو برابر است.
این بلوک بهعنوان یک جریان متوالی (۳۲ بیت درآنواحد) با سرعتی که توسط یک کلاک سیستم متفاوت دیگر کنترل میشوند، تنظیم میشود. در حافظه In GDDR5 این بلوک با دو برابر سرعت کلاک پایه کار میکنند و دادهها در هر لحظه دو بار جابجا میشود.
بنابراین در کارت گرافیک Radeon HD 6870 که درمجموع ۸ تراشه Radeon HD 6870 دارد، پردازنده گرافیکی آن میتواند در هر ثانیه ۱۰۷۵.۲ گیگابیت داده معادل ۱۳۴.۴ گیگابایت داده را انتقال دهد. این دادهها شامل ۲ گیگابیت داده که در هر لحظه منتقل میشود، ۲ گیگابیت کلاک داده با نرخ دو برابر، ۱.۰۵ گیگابیت کلاک پایه و ۸ گیگابیت داده مربوط به تراشهها و ۳۲ گیگابیت داده مربوط به پهنای باند میشود که در یکدیگر ضرب میشوند. این مقدار محاسبهشده بهعنوان پهنای باند تئوری حافظه کارت گرافیک شناخته میشود و هرچقدر بیشتر باشد، بهتر است (گیمرهای حرفهای همیشه میخواهند این مقدار به حداکثر میزان ممکن برسد). کارتهای گرافیک DDR6 از لحاظ سرعت انتقال داده در دو مدل عرضه میشود که یکی از آنان دارای سرعت انتقال داده دو برابر و یکی دیگر دارای سرعت انتقال چهار برابر است.
تمام کارت گرافیکهای موجود در بازار دارای حافظههای DDR6 و DDR5 نیستند. کارت گرافیکهای رده پایین و ارزانقیمت(مثل کارت گرافیکهای دارای سیستم خنککننده دمنده که قبلاً با آنها آشنا شدیم) مجهز به حافظههای رم DDR3 SDRAM هستند که اختصاصاً برای کارت گرافیک طراحی نشدهاند.
با توجه به اینکه پردازنده گرافیکی مورداستفاده در این دسته از کارتهای گرافیک کاملاً ضعیف هستند، استفاده از حافظههای رم عمومی هیچ مشکلی در عملکرد آنها ایجاد نمیکند.
انویدیا برای مدتی از حافظه GDDR5X استفاده کرد که دارای همان سرعت انتقال ۴ برابری GDDR6 است؛ اما سرعت کلاک آن بهاندازه GDDR6 نیست. AMD هم چند سالی است که در چنین کارت گرافیکهایی مثل Radeon R9 Fury X و Radeon VII از حافظه با سرعت بالا یا HBM (High Bandwidth Memory) استفاده کردند. تمام نسخههای حافظههای HBM پهنای باند بسیار بالایی دارند؛ اما کارتهای گرافیک دارای این نوع حافظه نسبت به کارت گرافیکهای مجهز به ماژولهای GDDR قیمت بالاتری دارند.
تراشههای حافظه باید جهت بهبود عملکرد پردازنده تا بهترین میزان ممکن، با سیم به خود پردازنده متصل شوند. چنین ساختاری در برخی از مواقع باعث میشود ردیابهای سیگنال که نشاندهنده مسیر سیمها روی برد مدارها هستند، ظاهر نسبتاً عجیبی پیدا کند.
چنانچه با دقت به تصویر بالا نگاه کنید متوجه میشود که برخی از ردیابهای سیگنال صاف و مستقیم و برخی دیگر مسیر پیچوخم داری دارند. دلیل ایجاد چنین مسیرهایی برای ردیابهای سیگنال این است که طول مسیرهای تمام ردیابهای سیگنال در فاصله بین پردازنده گرافیکی و تراشه حافظه، باید کاملاً یکسان باشد. استفاده از چنین ساختاری به جلوگیری از رخ دادن اتفاق بد و غیرقابلانتظار کمک میکند.
میزان حافظه مورداستفاده در کارتهای گرافیکهای امروزی، نسبت به دوران طراحی و ساخت نخستین پردازندههای گرافیکی به میزان قابلتوجهی تغییر کرده است.
پردازنده گرافیکی ATi Rage 3D Charger که قبلاً با آن آشنا شدیم، تنها از ۴ مگابایت حافظه EDO DRAM بهره میبرد؛ اما در حال حاضر این میزان حافظه هزاران برابر شده و استفاده از حافظههای ۴ تا ۶ گیگابایتی در کارتهای حافظه به یک استاندارد تبدیل شده است (این میزان حافظه در کارت گرافیکهای ردهبالا به دو برابر هم میرسد).
امروزه میزان استاندارد حافظه رم مورداستفاده در کامپیوترهای دسکتاپ و لپتاپها بهتازگی از ۸ گیگابایت هم بیشتر شده، کارتهای گرافیک هم در زمینه برخورداری از حافظههای دارای ظرفیت بالا، واقعاً پیشرفت کردهاند.
در حال حاضر حافظههای فوقسریع GDDR به این دلیل استفاده میشوند که پردازندههای گرافیکی باید دادهها را بهصورت موازی بخوانند یا بنویسند. پردازندههای گرافیکی مجتمع یا سیپییو دارای حافظه داخلی نیستند و برای ذخیرهسازی دادههای موردنیاز خود از حافظه کامپیوتر استفاده میکنند که در مقایسه با حافظههای DDR5 چند گیگابایتی مورداستفاده در کارتهای گرافیک، سرعت بهمراتب کمتری دارند؛ اما این موضوع را هم باید در نظر بگیریم که پردازندههای گرافیکی مجتمع بهاندازهای قوی نیستند که نیازمند استفاده از حافظههای DDR باشند.
تأمین نیروی موردنیاز کارتهای گرافیک
طبیعتاً کارتهای گرافیک نیز مانند سایر قطعات کامپیوتر نیازمند جریان برق هستند. میزان مصرف کارتهای گرافیک مختلف عمدتا به پردازنده گرافیکی مورداستفاده در آنها بستگی دارد؛ زیرا ماژولهای حافظه مورداستفاده در کارهای گرافیکی قطعات کممصرفی هستند و تنها چند وات برق مصرف میکنند.
کارت گرافیک برای تآمین نیرو میتواند از اسلات توسعه که به آن متصل شده است، استفاده کند (روشهای دیگری نیز برای تآمین نیرو وجود دارد که در ادامه در مورد آنها توضیح میدهیم). امروزه تقریباً در تمام کامپیوترهای دسکتاپ از رابط اتصال PCI Express استفاده میشود.
در تصویر بالا دو نوار باریک متشکل از پینها را میبینید که شامل یک نوار باریک در سمت چب و یک نوار بلندتر در سمت راست میشود). جریان برق از نوار باریک پینها به نوار بلندتر سمت راست که تنها مختص صدور دستورالعملها و انتقال دادهها است، منتقل می شود. نوار باریکتر دربردارنده پینها دارای ۲۲ پین (در هر طرف ۱۱ پین) است که تمام آنها برای تأمین نیروی کارت گرافیک استفاده نمیشوند و تنها تعدادی از آنها برای انجام این کار استفاده میشوند.
تقریباً نیمی از این ۲۲ پین برای انجام وظایف سیستمی عمومی و ساده مثل بررسی سلامت کارت یا تنها فعال و غیرفعال کردن دستورالعملها و مواردی از این دست استفاده میشوند. ویژگیهای جدیدترین نسخه رابط اتصال PCI Express محدودیتهایی را برای انتقال جریان از پاور سیستم ایجاد میکند و درمجموع دو مجموعه از خطوط انتقال ولتاژ را غیرفعال میکند.
در کارت گرافیکهای مدرن از خطوط ولتاژ + ۳.۳ ولت، جریان ۳ آمپری و از خطوط + ۱۲ ولت، جریان ۵ آمپری خارج میشود که درمجموع باعث ایجاد جریان ۷۵.۹ واتی میشود (۳x۳.۳ + ۵x۱۲= ۷۵.۹)
چنانچه کارت گرافیکی بیش از این میزان نیرو نیاز داشته باشد، چه باید کرد؟ بهعنوانمثال حداقل جریان مصرفی کارت گرافیک موردبررسی ما یعنی Radeon HD 6870 به میزان ۱۵۰ وات (دو برابر جریان قابل تعمیر توسط کانکتورها) است.
در چنین مواردی شرکتهای سازنده ساختار خاصی را ایجاد میکنند. در چنین ساختاری چند خط ولتاژ + ۱۲ ولت به سیستم اضافه میشود. این فرمت ساختاری با دو نوع کانکتور ایجاد میشود که شامل کانکتور ۸ پین و ۶ پین میشود.
در هر دو فرمت سه خط ولتاژ + ۱۲ ولت به سیستم اضافه میشود تفاوت بین این خطوط ولتاژ به تعداد خطوط زمین (ارت) مربوط میشود. کانکتور ۶ پین دارای سه اتصال ارت و کانکتور ۸ پین دارای ۵ اتصال ارت (یا مسیر ارت) است.
کانکتور ۸ پین دارای ۵ اتصال ارت، امکان انتقال جریان بیشتری از طریق کانکتور ۶ پین را فراهم میکند و حداکثر میزان جریان قابلانتقال از طریق این کانکتور را از ۷۵ وات به ۱۵۰ وات میرساند.
کارت گرافیک موردبررسی در این مقاله دارای دو کانکتور ۶ پین است؛ بنابراین از طریق سوکت توسعه PCI Express متصل به پاور میتوان جریانی معادل ۲۲۵ وات (۷۵+ (۷۵x۲)=۲۲۵) را به این کارت گرافیک منتقل کرد که بیش از میزان موردنیاز آن است.
البته مشکلی در رابطه با این موضوع وجود دارد و آن هم کار نکردن سیپییو و حافظه تراشه با ولتاژ +۳.۳ یا مثبت ۱۲ ولت است. تراشههای GDDR5 نیازمند ولتاژ ۱.۳۵ ولت و پردازنده گرافیکی AMD نیازمند ۱.۱۷۲ ولت است؛ بنابراین ولتاژ مورداستفاده برای این قطعات باید با دقت بالایی تأمین و تنظیم شود. این کار توسط قطعههایی به نام ماژول تنظیمکننده ولتاژ (voltage regulator modules) یا بهاختصار VRM انجام میشود.
در مادربردها و واحدهای منبع تغذیه (پاورها) از ماژولهای تنظیمکننده ولتاژ مشابهی استفاده میشود و تمام آنها دارای مکانیسمهای استاندارد یکسانی هستند. در ضمن زمانی که این قطعات کار میکنند، دمای آنها به میزان قابلتوجهی افزایش مییابد. به همین دلیل در زیر یک هیت سینک قرار میگیرند تا از افزایش دمای آنها در هنگام انجام عملیات جلوگیری شود. تعداد و نوع ماژولهای تنظیم ولتاژ مورد استفاده در کارت گرافیک روی میزان پایدار بودن عملکرد آن در زمانی که اورکلاک میشود، تآثیر زیادی دارد. (این موضوع در مورد عملکرد مادربرد و سیپییو هم صدق میکند)؛ زیرا کیفیت تراشه کنترلکننده میزان جریان کلی اهمیت بسیار زیادی دارد.
در کارت گرافیک Radeon HD 6870 که یک دهه از ساخت آن میگذرد، از تراشه CHIL CHL821401 استفاده میشود که در حقیقت یک کنترلر مدولاسیون پهنای باند با فاز۴+۱ است (این تراشه میتواند علاوه بر مدیریت ۴ ماژول تنظیمکننده ولتاژ، سیستم تنظیمکننده ولتاژ دیگری را نیز مدیریت کند). این تراشه میتواند دما و میزان جریان انتقالی را نیز کنترل کند.
درضمن این تراشه قادر است تعدادی از ماژولهای تنظیمکننده ولتاژ را برای سوییچ شدن آنها بین ۳ ولتاژ متفاوت تنظیم کند. این ویژگی در کارت گرافیکهای مدرن بهمنظور کاهش ولتاژ مصرفی آنها در هنگامیکه هیچ فعالیتی انجام نمیدهد، استفاده میشود. هدف از کاهش ولتاژ در چنین مواقعی کاهش مصرف و همچنین کاهش دما و صدای کارت گرافیک است.
هرچقدر کارت گرافیک پرمصرفتر باشد، به همان نسبت باید تعداد ماژولهای تنظیم ولتاژ افزایش یابد و کنترلر مدولاسیون پهنای باند باکیفیتی نیز استفاده شود. در ادامه آناتومی سیستم خنککننده، برد مدار و قطعات کارت گرافیک انویدیا GeForce RTX 2080 را بررسی میکنیم.
همانطور که مشاهده میکنید.در تصویر بالا یک باتری متشکل از ۱۰ ماژول تنظیمکننده ولتاژ را که از بالا تا پایین کشیده شده و در سمت راست کارت گرافیک قرار دارد، مشاهده میکنید. در کارت گرافیکهای برند EVGA تعداد این ماژولها دو برابر است؛ البته نباید فراموش کنیم که این کارت گرافیکها برای اورکلاک شدن به میزان بسیار بالا طراحی شدهاند و در هنگامی بهشدت اورکلاک میشوند، مصرف آنها به ۳۰۰ وات هم میرسد؛ البته خوشبختانه میزان مصرف تمام کارتهای گرافیک در این حد نیست. بهترین کارتهای گرافیک میان ردهای که در حال حاضر در بازار موجود هستند، مصرفی بین ۱۲۵ تا ۱۷۵ دارند که تقریباً در حد میزان مصرف کارت گرافیک ما است.
آناتومی پورتهای کارت گرافیک و سیستم مرتبط با نمایش تصویر روی مانیتور
اکنون که در مورد قطعات الکترونیکی نصبشده روی کارت گرافیک و چگونگی تأمین نیروی مورد نیاز آنها توضیح دادیم، اجازه دهید ببینیم چگونه دستورالعملها و دادهها برای پردازنده گرافیکی ارسال میشوند و چگونه خروجی و نتیجه نهایی پردازش این دادهها در نمایشگر نمایش داده میشود. ارسال و دریافت دستورالعملها دادهها از طریق کانکتور PCI Express که قبلاً با آن آشنا شدهایم، انجام می شود. تمام فرآیند ارسال و دریافت دادهها از طریق پینهای نوار طولانی کانکتور اسلات انجام میشود. تمام پینهای ارسالکننده دادهها در یک طرف نوار و پینهای گیرنده دادهها در طرف دیگر آن قرار دارند.
ارتباط PCI Express با استفاده از روش سیگنال دهی تفاضلی یا سیگنال دهی دیفرانسیل (differential signalling) انجام میشود. در این روش برای انتقال اطلاعات بهصورت الکترونیکی از دو سیگنال مکمل استفاده میشود؛ بنابراین دو پین همراه با یکدیگر استفاده میشوند و یک بیت داده را در هر سیکل کلاک ارسال میکنند.
به ازای هر جفت پین اختصاص داده شده برای انتقال اطلاعات، دو پین اتصال ارت نیز وجود دارد بنابراین مجموعه کاملی از پینها، شامل دو پین ارسال اطلاعات، دو پین دریافت اطلاعات و دو پین اتصال ارت میشود. تمام آنها درمجموع یک خط انتقال داده یا بهاصطلاح لِین (Lane) را تشکیل میدهند.
تعداد خطوط مورداستفاده توسط دستگاه با برچسب x1، x4 x8 یا x16 مشخص میشوند (عدد بعد از X به تعداد خطوط یا همان لینها اشاره میکند). تقریباً تمام کارتهای گرافیک از ۱۶ لین یا به عبارت دیگر رابط اتصال PCI Express x16 استفاده میکنند. به بیان دیگر رابط اتصال PCI Express x16 مورداستفاده برای اکثر کارتهای گرافیک میتواند درهر سیکل کلاک ۱۶ بیت داده را ارسال یا دریافت کند. سیگنال ارسالکننده داده در یک رابط اتصال PCI Express 3.0 با فرکانس ۴ گیگاهرتزی اجرا میشود؛ اما داده طوری میتواند زمانبندی شود که در هر سیکل دوباره ارسال شود. انتقال داده به این شکل باعث ایجاد یک پهنای باند داده نظری با قابلیت انتقال ۱۲۸ مگابیت در ثانیه (۴ گیگاهرتز ضرب در ۲ در هر سیکل داده ضرب در ۱۶ بیت) یا ۱۶ مگابایت در ثانیه در هر مسیر میشود.
البته پهنای باند واقعی این نسخه از PCI Express بیشتر از این میزان و برابر با ۱۶ گیگابایت در ثانیه است؛ زیرا در فرایند سیگنالدهی این رابط اتصال از سیستم کدگذاری خاصی استفاده میشود که به دلیل استفاده از آن تعدادی از بیتهای داده (در حدود ۱.۵ درصد) از بین میروند تا کیفیت سیگنال حفظ شود. پهنای باند نسخه بعدی این رابط اتصال یعنی PCI Express 4.0 دو برابر شده و به ۳۲ گیگابایت در ثانیه رسیده و در دو نسخه بعدی یعنی PCI Express 6.0 و PCI Express 8.0 در هر نسخه دو برابر شده و به ترتیب به ۶۴ و ۱۲۸ گیگابایت در ثانیه رسیده است.
برخی از کارتهای گرافیک مثل کارت گرافیک HD 6870 ما دارای یک کانکتور اضافی هستند که در تصویر زیر میتوانید آن را مشاهده کنید.
چنین ساختاری به شما اجازه میدهد دو یا چند کارت گرافیک را به یکدیگر متصل کنید. در صورت نصب چند کارت گرافیک روی سیستم، دادهها با سرعت بیشتری به اشتراک گذاشته میشوند. هر یک از سازندههای کارت گرافیک برای متصل کردن چند کارت گرافیک به یکدیگر، سیستمی اختصاصی خود را طراحی و ایجاد کردهاند؛ بهعنوانمثال AMD آن را CrossFire و انویدیا آن را SLI نامیده است. در سیستم CrossFire از هیچ کانکتوری استفاده نمیشود و بهجای آن اسلات PCI Express مورداستفاده قرار میگیرد. اگر بار دیگر به تصویر RTX 2080 که قبلاً آن را نمایش دادهایم، نگاه کنید، دو نوع اتصال چند کارت گرافیک به یکدیگر را مشاهده میکنید.
این نوع اتصال، نسخه جدیدتری از ساختار مورداستفاده توسط انویدیا برای اتصال چند کارت گرافیک، به نام NVLink است. هدف اصلی از ایجاد این ساختار جدید، استفاده از آن برای متصل کردن کارتهای گرافیک حرفهای و کارتهای محاسباتی به یکدیگر است، نه کارتهای گرافیک معمولی و متداول. برخلاف تلاشهای AMD و انویدیا در راستای گسترش استفاده از سیستمهای متصلکننده چند کارت گرافیک به یکدیگر، این سیستمها بهصورت کلی چندان موفق نشدند و امروز بهتر است از یک کارت گرافیک و بهترین کارت گرافیکی که توان خرید آن را دارید، استفاده کنید.
تمام کارتهای گرافیک حداقل یک پورت برای متصل شدن به مانیتور دارند؛ اما برخی از آنها هم دارای چند پورت برای این منظور هستند.
کارت گرافیک رادئون موردبررسی ما چند پورت برای اتصال به مانیتور دارد که به شرح زیر هستند:
- دو پورت مینی دیسپلی پورت نسخه 1.2
- یک پورت HDMi نسخه 1.4a
- یک پورت DVI-D دو کاناله (فقط دیجیتال)
- یک پورت DVI-D دو کاناله (دیجیتال و آنالوگ)
در تصویر زیر میتوانید پورتهای این کارت گرافیک را مشاهده کنید.
طبیعتاً هرچقدر تعداد پورتهای کارت گرافیک بیشتر و متنوعتر باشد، میتواند به تعداد بیشتری از مانیتورها با پورتهای مختلف متصل شود. برخی از کارتهای گرافیک بهتنهایی میتوانند مانیتورها را مدیریت و کنترل کنند؛ اما گاهی اوقات یک تراشه اضافه برای بررسی سیگنالهای مختلف موردنیاز است. در کارت گرافیک موردبررسی ما سوئیچ P13HDMI4 HDMI پریکام (Pericom)، بخشی از این وظیفه را بر عهده دارد.
این تراشه کوچک داده HDMI را که دربردارنده استریمهای دیجیتالی صوتی و تصویری است، به سیگنالهای تصویری برای پورتهای DVI تبدیل میکنند.
ظهور پدیده ورزشهای الکترونیکی (آن دسته از مسابقات ورزشی که با استفاده از بازیهای ویدیویی برگزار میشوند) و سایر بازیهای کامپیوتری با تصاویری با حرکت بسیار سریع، سازندگان مانیتور به ساخت دستگاههایی با نرخ رفرش (تعداد دفعاتی که مانیتور میتواند در هر ثانیه تصاویر در حال نمایش تغییر دهد و آنها را بهروزرسانی کند) بالاتر نسبت به قبل سوق داده است. ۱۰ سال قبل تعداد بسیار زیادی از مانیتورها تنها دارای نرخ رشد ۶۰ یا ۷۵ هرتز بودند؛ اما امروزه مانیتورهای 1080p با نرخ رفرش ۲۴۰ هرتز هم بهراحتی در بازار یافت میشوند.
بسیاری از کارتهای گرافیک مدرن امروزی قدرت بالایی دارند و میتوانند تصاویری با رزولوشن بالا مثل رزولوشن 1440p یا 4K یا محتوای HDR را بدون هیچگونه مشکلی پردازش و اجرا. بسیاری از مانیتورها از قابلیت نرخ رفرش متغیر یا variable refresh rate (VRR) technology پشتیبانی میکند که زمانی که کارت گرافیک هنوز در حال پردازش تصاویر جدید است، از بهروزرسانی و تغییر تصاویر در حال نمایش جلوگیری میکند.
چندین فرمت مختلف برای نرخ رفرش متغیر وجود دارد که به شرح زیر هستند:
- DisplayPort Adaptive-sync
- HDMI 2.1 VRR
- AMD FreeSync
- Nvidia G-Sync
برای استفاده از این سه ویژگی (به عبارت دیگر رزولوشن بالا، نرخ رفرش بالا و نرخ رفرش متغیر) سه سؤال مطرح میشود که باید به آنها پاسخ داده شود. آیا مانیتور از این قابلیتها پشتیبانی میکند؟ آیا کارت گرافیک از آنها پشتیبانی میکند؟ آیا کارت گرافیک از کانکتورهای خارجی با قابلیت پشتیبانی از این ویژگیها استفاده میکند؟
در جدول زیر میتوانید رزولوشن و نرخ رفرشی را که جدیدترین کارتهای گرافیک AMD (Navi) و انویدیا در انواع مختلف پورتها از آنها پشتیبانی میکنند، ببینید.
سازنده | AMD | انویدیا |
DVI | دیجیتال دو کاناله | دیجیتال دو کاناله |
دیسپلی پورت | 1600p و ۶۰ هرتز. ۱۰۸۰p و ۱۴۴ هرتز1.4a (DCS 1.2) (نسخه) | 1600p و ۶۰ هرتز. ۱۰۸۰p و ۱۴۴ هرتز 1.4a (DCS 1.2) (نسخه |
HDMI | 4K HDR و ۲۴۰ هرتز. 8K HDR و ۶۰ هرتز2.0 (نسخه)4K و ۶۰ هزتز. 1080p و ۲۴۰ هرتز | 4K HDR و ۲۴۰ هرتز. 8K HDR و ۶۰ هرتز2.0 (نسخه) |
VRR | DP Adaptive-sync، HDMI VRR، FreeSync | DP Adaptive-sync، HDMI VRR، FreeSync |
اعداد ذکرشده در جدول بالا تمام اطلاعات لازم را ارائه نمیدهند. بدون تردید شما میتوانید محتوای 4K را که از طریق پورت دیسپلی پورت به مانیتوری با نرخ رفرشی بالاتر از ۲۴۰ هرتز نمایش داده میشود، کاملا روان و بدون هیچگونه مشکلی ببینید؛ اما پردازش داده خام در حافظه رم کارت گرافیک به این سادگی نیست. تمام قابلیتها که میتوانیم به آنها به چشم خروجی نگاه کنیم، تنها ارسال تعداد زیادی بیت در هر ثانیه را امکانپذیر میکنند و برای نمایش تصاویری که واقعاً دارای رزولوشن بالایی باشند و با نرخ رفرش بالایی پخش شوند، به تنهایی کافی نیستند.
خوشبختانه فشردهسازی داده یا نمونهبرداری کروما (فرآیندی که در آن میزان اطلاعات رنگی ارسالشده کاهش داده میشود) میتواند برای کاهش فشار روی سیستم مانیتور استفاده شود. اینجا است که تفاوتهای جزئی بین مدلهای مختلف کارت گرافیک میتواند تأثیرگذار باشد. ممکن است کارت گرافیکی از سیستم فشردهسازی استاندارد، روشهای مختص به خود یا شیوهای از نمونهبرداری کروم استفاده کند.
بیست سال پیش خروجیهای ویدیویی کارتهای گرافیک مختلف تفاوت زیادی با یکدیگر داشتند و گاهی اوقات کاربران مجبور بودند کیفیت تصویر را قربانی سرعت کنند؛ اما خوشبختانه امروزه کاربران اصلاً چنین دوراهی دشواری را در مقابل خود ندارند
سخن پایانی
ممکن است از وجود این همه پیچیدگی در کارت گرافیک تنها برای نمایش تصاویر بازی تعجب کنید؛ اما باید بدانید که پردازشگ گرافیکی فرآیند بسیار پیچیدهای محسوب میشود و نیازمند محاسبات ریاضی بیشماری نیز است. کارت گرافیک ATi 3D Charger میتواند در هر ثانیه تا یک میلیون مثلث رنگی را در ۲۵ میلیون پیکسل نمایش دهد؛ امروزه این اعداد و ارقام برای یک کارت گرافیک با قیمت مشابه این کارت گرافیک در زمان خود، دو هزار برابر شدهاند
حتماً از خود میپرسید آیا واقعاً وجود چنین کارت گرافیکی در سیستم لازم است؟ جواب مثبت است؛ زیرا از یک سو گرافیک بازیهای امروزی نسبت به بازیهای چند دهه قبل کاملاً متحول شده و طبیعتا نمایش تصاویری با گرافیک بسیار بالا نیازمند قدرت پردازشی بسیار بالا نیز است. در ضمن رندر کردن جلوههای بصری سهبعدی بهصورت آنی و لحظهبهلحظه هم فعالیت پردازشی بسیار دشواری محسوب میشود.
نکته دیگری که باید به آن اشاره کنیم این است که قابلیتهای برخی از کارتهای گرافیک امروزی تنها به پردازش تصاویر محدود نمیشود و امروزه برخی از کارتهای گرافیک بسیار قدرتمند و کاملاً حرفهای در ابرکامپیوترها برای انجام محاسبات بسیار پیچیده مرتبط با یادگیری ماشینی و هوش مصنوعی نیز استفاده میشوند.
همانطور که میدانید در سالهای اخیر استخراج رمزارزها یا بهاصطلاح ماینینگ کردن آنها به یکی از فعالیتهای بسیار محبوب و پرسود برای کسب درآمد تبدیل شده است (محبوبیت استخراج رمزارزها از ۲۰۱۸ به طرز شگفتانگیزی افزایش یافته است). کارتهای گرافیک قدرتمند و حرفهای گجتهای ایدهآلی برای انجام این کار هستند.
وقتی صحبت از کلمه محاسبه یا Computing میشود، ممکن است کمی سردرگم شویم و تصور کنید انجام فعالیتهای محاسباتی در حیطه وظایف سیپییو است نه کارت گرافیک؛ اما در برخی از حیطههای نیازمند انجام فعالیتهای محاسباتی موازی یا به اصلاح رایانش موازی، کارت گرافیک هم استفاده می شود. این دسته از فعالیتهای محاسباتی با بهرهمندی از مقادیر داده با دقت بسیار بالا انجام میشود.
هم AMD و هم انویدیا کارتهای گرافیک بسیار قدرتمندی را با قابلیت انجام چنین فعالیتهای محاسباتی روانه بازار کردهاند و این دو شرکت همیشه بزرگترین و قدرتمندترین پردازندههای گرافیکی را تولید کردهاند. مطمئناً فردی که ۲۵۰۰ دلار برای خرید یک کارت گرافیک پرداخت میکند، انتظارات زیادی از آن دارد و این انتظارات باید به نحو احسن برآورده شوند.
البته کارتهای گرافیک چه ۲۰ دلار باشند، چه ۲۰۰ دلار و چه ۲۰۰۰ دلار، طراحی و ساختار پایه یکسانی دارند و قطعات تمام آنها شامل یک پردازنده طراحیشده بهصورت اختصاصی برای انجام پردازشهای گرافیکی، یک برد مدار با تعداد زیادی تراشه مختلف برای ایجاد پشتیبانی از قابلیتهای مختلف و تعداد بسیار زیادی از قطعات الکترونیکی دیگر میشود. اگرچه ممکن است کارت گرافیک در مقایسه با مادربرد یا پاور ساختار سادهتری داشته باشد؛ اما این قطعه نیز قطعه شگفتانگیزی محسوب میشود و خلق تصاویری با کیفیت شگفتانگیز توسط آن با بهرهمندی از میلیاردها ترانزیستور واقعاً هیجانانگیز است.