براساس شایعات جدید منتشر شده در خصوص مشخصات فنی کارت گرافیک پرچمدار GeForce RTX 4090 و Radeon RX 7900 XT میتوان به جزئیات معماری RDNA 3 و Ada Lovelace پرداخت.
اخیرا Greymon55 در توییتر جزییات جدیدی از مشخصات پرچمداران نسل بعد انویدیا و AMD را به اشتراک گذاشته است. اطلاعاتی که اخیرا این منبع غیررسمی در خصوص انواع پردازندههای جدید و عرضه نشده انتشار میدهد، عموما موثق میباشد. بر این اساس گفته میشود که کارت گرافیک پرچمدار GeForce RTX 4090 مبتنیبر پردازندههای گرافیکی AD102 با معماری Ada Lovelace تولید میشود. در ساختار پرچمدار AMD، یعنی Radeon RX 7900 XT نیز از یک پردازنده Navi 31 با معماری RDNA 3 استفاده خواهد شد.
طبق انتظار هر دو کارت گرافیک باید پیشرفت چشمگیری را نسبت به نسل قبل ایجاد کنند و البته متعاقبا به پرمصرفترین پردازندههای گرافیکی تا به امروز تبدیل شوند. درحالی که کارت گرافیک بر پایه NVIDIA همچنان طراحی یکپارچه تراشههای گرافیکی خود را در معماری Ada Lovelace حفظ خواهد کرد، AMD قصد دارد با به کارگیری سبک طراحی MCM یا مولتی چیپ ماژول، تجربه موفق خود در عرضه پردازندههای قدرتمند Aldebaran با معماری CDNA 2 برای دیتاسنترها را در محصولات گیمینگ خود نیز تکرار کند.
کارت گرافیک بر پایه AMD امسال سبک MCM را هم برای محصولات عمومی و هم برای تراشههای رده بالای گیمینگ خود به کار میگیرد. حالا و با اشاره به یک پیش زمینه اولیه، به سراغ جزئیات جدیدی که توسط این منبع فاشکننده منتشر شده، خواهیم رفت.
کارت گرافیک AMD Radeon RX 7900 XT
پرچمداری سری RDNA 3، پردازنده گرافیکی AMD Navi 31 محسوب میشود؛ که در نسل جدید توان گرافیکی Radeon RX 7900 XT را تأمین خواهد کرد. طبق اطلاعاتی که از قبل به گوش میرسید AMD در این نسل CU یا واحدهای محاسباتی را کنار گذاشته و بهجای آن از WGP یا Work Group Processors استفاده میکند. از آنجایی که Navi 31 یک پردازنده MCM محسوب میشود، از دو کلید IP برخوردار است؛ شامل یک GCD (یا Graphics Core Die) براساس فرایند ۵ نانومتری TSMC و یک MCD (Multi-Cache Die) براساس فناوری ۶ نانومتری TSMC میشود. شایعات قبلی از تکمیل فرایند توسعهی تراشههای Navi 31 توسط AMD حکایت دارند.
پیکربندی تراشههای Navi 31 شامل دو بخش GCD و یک بخش MCD است؛ که هریک از دایهای GCD از ۳ شیدر انجین (در مجموع شش Shader Engine) و هر شیدر انجین متشکل از دو آرایه شیدر (Shader Array) است (در مجموع ۱۲ آرایه SA). اما هریک از این آرایههای شیدر میزبان ۵ WGP هستند (تعداد کل WGP ها به ۶۰ عدد میرسد) و هر WGP متشکل از ۸ واحد SIMD32 با ۳۲ واحد ALU خواهد بود. (یعنی در جمعا ۴۸۰ واحد SIMD32) این واحدهای SIMD32 نیز با هم تلفیق شده و ۷۶۸۰ هسته در هریک از قسمتهای GCD و ۱۵۳۶۰ هسته بهطور کلی را شکل میدهند.
طبق انتظار سرعت کلاک این GPU به ۲.۴ تا ۲.۵ گیگاهرتز رسیده و عملکرد گرافیکی آن را از نظر تئوری به ۷۵ ترافلاپس برساند. یعنی یک پیشرفت خیره کننده ۲۲۶ درصدی نسبت به چیزی که در Radeon RX 6900 XT شاهد آن هستیم. دای MCD در تراشههای RDNA 3 ازطریق یک رابط داخلی Infinity Fabric به واحد دوگانهی GCD متصل میشود که متشکل از ۲۵۶ تا ۵۱۲ مگابایت حافظه Infinity Cache خواهد بود. هر کارت گرافیک باید از ۴ لینک اتصال حافظه (۳۲ بیت) برخوردار باشد که در نتیجه به ۸ کنترلر حافظه ۳۲ بیت در یک رابط اینترفیس ۲۵۶ بیتی منجر خواهد شد.
ادعا شده که این کارت به حداکثر ۳۲ گیگابایت حافظه GDDR6 مجهز خواهد شد که با سرعت پین ۱۸ گیگابیت بر ثانیه و پهنای باند ۵۷۶ گیگابایت بر ثانیه عمل میکند. شایعات دیگری که در این خصوص منتشر شده، از به کارگیری فناوری 3D Infinity Cache در محصولات سری RDNA 3 حکایت دارد. در این فناوری تراشههای جدید حافظه در یک ساختار عمودی روی GPU قرار میگیرند. شبیه به چیزی که در حافظه کش L3 تراشههای Vermeer-X شاهد آن بودیم.
پیشنهاد مطالعه: در مورد پردازنده AMD نیز اطلاعات جدیدی کسب کنید.
مقایسه نسل به نسل پردازندههای گرافیکی RDNA
نام GPU | Navi 10 | Navi 21 | Navi 31 |
فرایند تولید | 7nm | 7nm | 5nm (6nm?) |
پکیج GPU | یکپارچه | یکپارچه | MCD |
Shader Engine | 2 | 4 | 6 |
WGP | 20 | 40 | 60 |
SP به ازای WGP | 128 | 128 | 256 |
واحدهای محاسباتی (در هر Die) | 40 | 80 | 240 |
تعداد هسته (در هر Die) | 2560 | 5120 | 15360 |
گذرگاه حافظه | 256bit | 256bit | 256bit |
نوع حافظه | GDDR6 | GDDR6 | GDDR6 |
حجم حافظه | 8GB | 16GB | 32GB |
Infinity Cache | 8GB | 16GB | 32GB |
مدل پرچمدار | Radeon RX 5700 XT | Radeon RX 6900 XTX | Radeon RX 7900 XT |
توان مصرفی | 225W | 330W | 350-550W |
زمان عرضه | Q3 2019 | Q4 2020 | Q4 2022 |
کارت گرافیک GeForce RTX 4090
گفته میشود که انویدیا (Nvidia) در این نسل از پردازندههای گرافیکی خود از فناوری تولید ۵ نانومتری TSMC استفاده میکند. این موضوع شامل پردازنده AD102 که از یک طراحی کاملاً یکپارچه برخوردار است نیز میشود. Greymon55 در توییت جدید خود و جایی که از جزئیات این GPU صحبت کرده، به سرعت کلاک ۲.۵ گیگارهرتز (با سرعت میانگین بوست ۲.۳ گیگارهرتز) تراشهی AD102 اشاره کرده است. بنابراین این مقدار را بهعنوان اساس محاسبات و پیشبینی عملکرد این GPU قرار داده و ادامه میدهیم.
ظاهراً پردازنده AD102 از ۱۸۴۳۲ هستهی CUDA برخوردار است که ۱۴۴ واحد SM این تراشه را تشکیل میدهند. یعنی حدود دو برابر تعداد هستههای پرچمدار سری Ampere که همین حالا هم ارتقاء چشمگیری نسبت به سری Turing محسوب میشوند. سرعت ۲.۳ تا ۲.۵ گیگاهرتز این پردازنده از نظر تدوری به ۸۵ تا ۹۲ ترافلاپس توان پردازش گرافیکی منجر میشود که بیش از دو برابر توان عملکرد ۳۶ ترافلاپسی کارت گرافیک قدرتمند RTX 3090 در نسل فعلی خواهد بود.
عملکرد پردازندههای گرافیکی انویدیا 150% پیشرفت خواهند داشت که این جهش بزرگی محسوب میشود اما بهخاطر داشته باشید که انویدیا در نسل فعلی کارت گرافیکهای RTX نیز بهبود قابل توجهی را نسبت به نسل قبل تجربه کرده بود. تراشهی پرچمدار GA102 که در کارت گرافیک RTX 3090 مورد استفاده قرار میگیرد، از ۳۶ ترافلاپس توان پردازش گرافیکی برخوردار است. درحالی که تراشهی TU102 در کارت گرافیک پرچمدار RTX 2080 Ti تنها ۱۳ ترافلاپس توان پردازش گرافیکی را ارائه میکرد.
این موضوع نشان میدهد که خانوادهی امپر از نظر تئوری بیش از ۱۵۰ درصد قویتر از سری تورینگ شده بود، درحالی که این اختلاف در واقعیت به ۵۰ تا ۶۰ درصد میرسید. بنابراین باید بهخاطر داشته باشیم که این روزها عدد ترافلاپس مستقیماً بیانگر عملکرد یک پردازنده گرافیکی نخواهد بود. علاوهبراین، نمیدانیم که عدد ۲.۳ تا ۲.۵ گیگاهرتزی دقیقاً مربوطبه سرعت کلاک متوسط این کارت است یا به حداکثر سرعت بوست آن تعلق دارد که نشان میدهد پتانسیل توان محاسباتی AD102 میتواند بالاتر از اینها باشد.
هم چنین افشا کننده این اطلاعات ادعا میکند که پرچمدار سری NVIDIA GeForce RTX 4090 مشابه RTX 3090 از یک رابط گذرگاه ۳۸۴ بیت برخوردار است. اما جالب اینجا است که در اینجا به G6X اشاره شده که یعنی انویدیا در نسل جدید هم به سراغ استاندارد حافظهی جدید نخواهد رفت، تا بعد از سری Ada Lovelace از یک تکنولوژی جدیدتر (مثلاً GDDR7) برای این منظور استفاده کند. این کارت از ۲۴ گیگابایت حافظه استفاده میکن. باید انتظار یک ماژول یک طرفهی ۱۶ گیگابایتی DRAM را داشته باشیم یا یک ماژول ۲ دوگانهی ۸ گیگابایتی DRAM.
پیشنهاد مطالعه: جدیدترین خنک کننده ایسوس را در سامان پیسی دنبال کنید.
مقایسه نسل به نسل پردازندههای گرافیکی Nvidia
نام GPU | TU102 | GA102 | AD102 |
معماری | Turing | Ampere | Ada Lovelace |
فناوری ساخت | TSMC 12nm NFF | Samsung 8nm | 5nm |
کلاسترهای پردازش گرافیکی (GPC) | 6 | 7 | 12 |
کلاسترهای پردازش تکسچرها (TPC) | 36 | 42 | 72 |
مولتی پردازنده های جریانی | 72 | 84 | 144 |
تعداد هسته های CUDA | 4608 | 10752 | 18432 |
ترافلاپس تئوری | 16.1 | 37.6 | 90TFLOPs |
نوع حافظه | GDDR6 | GDDR6X | GDDR6X |
گذرگاه حافظه | 384bit | 384bit | 384bit |
ظرفیت حافظه | 11GB (2080) | 24GB (3090) | 24GB (4090) |
مدل پرچمدار | RTX 2080 | RTX 3090 | RTX 4090 |
توان مصرفی | 250W | 350W | 450-650W |
زمان عرضه | Sep. 2018 | Sept. 20 | 2022 |
پردازندههای گرافیکی Ada Lovelace انویدیا، در نسل جدید کارت گرافیکهای GeForce RTX 4090 به رقابت مستقیم با تراشههای مبتنی بر معماری RDNA 3 شرکت AMD در کارت گرافیک Radeon RX 7900 XT خواهند رفت. هنوز هم گمانهزنیهایی مبنیبر احتمال استفادهی انویدیا از سبک معماری MCM شنیده میشود.
پردازندهی گرافیکی Hopper با ساختار MCM بهطور ویژه برای دیتا سنترها و تجهیزات مبتنیبر هوش مصنوعی توسعه داده شده و بهزودی فرایند طراحی آنها تکمیل خواهد شد. البته گفته میشود که انویدیا فعلاً طراحی MCM را به همین محصولات محدود کرده و در سری Ada Lovelace مورد استفاده قرار نخواهد داد.
در آخر دعوت می کنیم برای دریافت مشاوره رایگان جهت انتخاب و خرید بهترین کارت گرافیک به وب سایت شرکت سامان پی سی مراجعه نمایید و یا با شماره تلفن 28421893-021 با کارشناسان ما تماس بگیرید.