پردازندههای نسل جدید انویدیا، مانند B100 و B200، میتوانند تا 1000 وات برق مصرف کنند که نشاندهندهی افزایش 40 درصدی مصرف برق نسبت به نسل قبلی است. این افزایش مصرف برق به دلیل افزایش تعداد هستهها، ترانزیستورها و فرکانس کاری این پردازندهها است.
به گزارش تکناک،دل، یکی از بزرگترین سازندگان سرور در جهان، اطلاعات محرمانهای را در مورد پردازندههای هوش مصنوعی آیندهی انویدیا با اسم رمز “Blackwell” فاش کرده است. ظاهرا این پردازندهها تا ۱۰۰۰ وات برق مصرف خواهند کرد که ۴۰ درصد افزایش نسبت به نسل قبل است. این افزایش مصرف برق، دل را مجبور میکند تا از خلاقیت مهندسی خود برای خنک کردن این پردازندهها استفاده کند. همچنین ممکن است صحبتهای دل، اشارهای به برخی ویژگیهای خاص معماری پردازندههای محاسباتی آیندهی انویدیا داشته باشد.
تامزهاردور گزارش میدهد که ایوان مکگیل، مدیر مالی دل میگوید، هر گونه پیشرفتی در مورد H200 و افزایش عملکرد آن، ما را هیجانزده میکند. ما همچنین از B100 و B200 نیز هیجانزده هستیم و فکر میکنیم که این یک فرصت دیگر برای نشان دادن تواناییهای مهندسی ماست. تخصص ما در مدیریت حرارت به ما این امکان را میدهد تا بدون نیاز به خنککننده مایع مستقیم، به تراکم انرژی ۱۰۰۰ وات به ازای هر پردازنده دست پیدا کنیم.
Tom’s Hardware | Nvidia H100 (current) | Nvidia B100 (Dell est.) | AMD MI300X | Nvidia H200 (current) |
FP16/bf16 TFLOPS | 989 | ? | 1307 | 989 |
Power Consumption | 700W | 1000W | 750W | 700W |
Die Size (sq mm) | 814 | ? | 1017 | 814 |
از آنجایی که از برنامههای انویدیا در مورد معماری Blackwell اطلاع نداریم، تنها میتوانیم به قانون کلی اتلاف گرما اشاره کنیم که میگوید اتلاف گرما معمولا در حدود ۱ وات به ازای هر میلیمتر مربع از سطح تراشه است.
اینجا از نظر ساخت تراشه، موضوع جالب میشود. پردازندهی H100 انویدیا (که با فناوری اختصاصی ۴ نانومتری ساخته شده است) با احتساب حافظهی HBM، حدود ۷۰۰ وات گرما تولید میکند، در حالی که اندازهی سطح تراشهی آن ۸۱۴ در ۸۱۴ است، بنابراین در محدودهی زیر ۱ وات به ازای هر میلیمتر مربع قرار میگیرد. این تراشه با فناوری اختصاصی TSMC برای عملکرد بهبودیافته در کلاس ۴ نانومتر ساخته شده است.
احتمالاً نسل بعدی پردازندههای گرافیکی انویدیا با فناوری دیگری از کلاس ۳ نانومتر و با عملکرد بهبودیافته ساخته خواهد شد. با توجه به میزان مصرف برق تراشه و اتلاف گرمای مورد نیاز، منطقی به نظر میرسد که B100 انویدیا اولین طراحی دو تراشهای این شرکت باشد. این کار باعث میشود تا سطح بیشتری برای دفع گرمای تولید شده وجود داشته باشد. ما قبلاً شاهد استفاده از معماریهای پردازندهی گرافیکی چند تراشهای توسط AMD و Intel بودهایم، بنابراین این حرکت با روندهای دیگر صنعت همخوانی دارد.
در کاربردهای هوش مصنوعی و ابررایانهی با عملکرد بالا، باید عملکرد اندازهگیری شده با فلاپ (FLOPS) و انرژی مورد نیاز برای رسیدن به این فلاپ و خنک کردن انرژی گرمایی حاصل را در نظر بگیریم. برای توسعهدهندگان نرمافزار، مهم است که بدانند چگونه از این فلاپها به طور کارآمد استفاده کنند. برای توسعهدهندگان سختافزار، مهم است که بدانند پردازندههایی را که این فلاپها را تولید میکنند، چگونه خنک کنند.
این همان جایی است که دل ادعا میکند فناوریهایش از رقبای این شرکت پیشی خواهند گرفت و به همین دلیل است که مدیر مالی دل در مورد پردازندههای نسل بعدی Blackwell انویدیا صحبت کرده است.
مکگیل با اشاره به پردازندهی هوش مصنوعی و ابررایانهی بعدی انویدیا میگوید: این اتفاق در سال آینده با B200 رخ خواهد داد. فرصتی برای ما وجود دارد تا مهندسی خود، سرعت عمل و کارهایی که به عنوان رهبر صنعت انجام دادهایم را به نمایش بگذاریم تا تخصص خود را در زمینهی کارایی خنککنندهی مایع در مقیاس بزرگ و همچنین موارد دیگر مانند شیمی و عملکرد سیال، کار اتصال، تلهمتری و مدیریت انرژی به کار بگیریم.
این کار به ما این امکان را میدهد تا برای ورود به بازار در مقیاس بزرگ و بهرهمندی از این ظرفیت محاسباتی فوقالعاده در بازار آماده باشیم.