انویدیا کارت گرافیک هوش مصنوعی 1000 واتی می‌سازد

پردازنده‌های نسل جدید انویدیا، مانند B100 و B200، می‌توانند تا 1000 وات برق مصرف کنند که نشان‌دهنده‌ی افزایش 40 درصدی مصرف برق نسبت به نسل قبلی است. این افزایش مصرف برق به دلیل افزایش تعداد هسته‌ها، ترانزیستورها و فرکانس کاری این پردازنده‌ها است.

به گزارش تک‌ناک،دل، یکی از بزرگترین سازندگان سرور در جهان، اطلاعات محرمانه‌ای را در مورد پردازنده‌های هوش مصنوعی آینده‌ی انویدیا با اسم رمز “Blackwell” فاش کرده است. ظاهرا این پردازنده‌ها تا ۱۰۰۰ وات برق مصرف خواهند کرد که ۴۰ درصد افزایش نسبت به نسل قبل است. این افزایش مصرف برق، دل را مجبور می‌کند تا از خلاقیت مهندسی خود برای خنک کردن این پردازنده‌ها استفاده کند. همچنین ممکن است صحبت‌های دل، اشاره‌ای به برخی ویژگی‌های خاص معماری پردازنده‌های محاسباتی آینده‌ی انویدیا داشته باشد.

تامزهاردور گزارش می‌دهد که ایوان مک‌گیل، مدیر مالی دل می‌گوید، هر گونه پیشرفتی در مورد H200 و افزایش عملکرد آن، ما را هیجان‌زده می‌کند. ما همچنین از B100 و B200 نیز هیجان‌زده هستیم و فکر می‌کنیم که این یک فرصت دیگر برای نشان دادن توانایی‌های مهندسی ماست. تخصص ما در مدیریت حرارت به ما این امکان را می‌دهد تا بدون نیاز به خنک‌کننده مایع مستقیم، به تراکم انرژی ۱۰۰۰ وات به ازای هر پردازنده دست پیدا کنیم.

Tom’s Hardware	Nvidia H100 (current)	Nvidia B100 (Dell est.)	AMD MI300X	Nvidia H200 (current)
FP16/bf16 TFLOPS	989	?	1307	989
Power Consumption	700W	1000W	750W	700W
Die Size (sq mm)	814	?	1017	814

از آنجایی که از برنامه‌های انویدیا در مورد معماری Blackwell اطلاع نداریم، تنها می‌توانیم به قانون کلی اتلاف گرما اشاره کنیم که می‌گوید اتلاف گرما معمولا در حدود ۱ وات به ازای هر میلی‌متر مربع از سطح تراشه است.

اینجا از نظر ساخت تراشه، موضوع جالب می‌شود. پردازنده‌ی H100 انویدیا (که با فناوری اختصاصی ۴ نانومتری ساخته شده است) با احتساب حافظه‌ی HBM، حدود ۷۰۰ وات گرما تولید می‌کند، در حالی که اندازه‌ی سطح تراشه‌ی آن ۸۱۴ در ۸۱۴ است، بنابراین در محدوده‌ی زیر ۱ وات به ازای هر میلی‌متر مربع قرار می‌گیرد. این تراشه با فناوری اختصاصی TSMC برای عملکرد بهبودیافته در کلاس ۴ نانومتر ساخته شده است.

احتمالاً نسل بعدی پردازنده‌های گرافیکی انویدیا با فناوری دیگری از کلاس ۳ نانومتر و با عملکرد بهبودیافته ساخته خواهد شد. با توجه به میزان مصرف برق تراشه و اتلاف گرمای مورد نیاز، منطقی به نظر می‌رسد که B100 انویدیا اولین طراحی دو تراشه‌ای این شرکت باشد. این کار باعث می‌شود تا سطح بیشتری برای دفع گرمای تولید شده وجود داشته باشد. ما قبلاً شاهد استفاده از معماری‌های پردازنده‌ی گرافیکی چند تراشه‌ای توسط AMD و Intel بوده‌ایم، بنابراین این حرکت با روندهای دیگر صنعت همخوانی دارد.

در کاربردهای هوش مصنوعی و ابررایانه‌ی با عملکرد بالا، باید عملکرد اندازه‌گیری شده با فلاپ (FLOPS) و انرژی مورد نیاز برای رسیدن به این فلاپ و خنک کردن انرژی گرمایی حاصل را در نظر بگیریم. برای توسعه‌دهندگان نرم‌افزار، مهم است که بدانند چگونه از این فلاپ‌ها به طور کارآمد استفاده کنند. برای توسعه‌دهندگان سخت‌افزار، مهم است که بدانند پردازنده‌هایی را که این فلاپ‌ها را تولید می‌کنند، چگونه خنک کنند.

این همان جایی است که دل ادعا می‌کند فناوری‌هایش از رقبای این شرکت پیشی خواهند گرفت و به همین دلیل است که مدیر مالی دل در مورد پردازنده‌های نسل بعدی Blackwell انویدیا صحبت کرده است.

مک‌گیل با اشاره به پردازنده‌ی هوش مصنوعی و ابررایانه‌ی بعدی انویدیا می‌گوید: این اتفاق در سال آینده با B200 رخ خواهد داد. فرصتی برای ما وجود دارد تا مهندسی خود، سرعت عمل و کارهایی که به عنوان رهبر صنعت انجام داده‌ایم را به نمایش بگذاریم تا تخصص خود را در زمینه‌ی کارایی خنک‌کننده‌ی مایع در مقیاس بزرگ و همچنین موارد دیگر مانند شیمی و عملکرد سیال، کار اتصال، تله‌متری و مدیریت انرژی به کار بگیریم.

این کار به ما این امکان را می‌دهد تا برای ورود به بازار در مقیاس بزرگ و بهره‌مندی از این ظرفیت محاسباتی فوق‌العاده در بازار آماده باشیم.