تنسورداین از ورود تراشه هوش مصنوعی نیپیر به فاز تولید خبر داد و مدعی شد این محصول با کارایی بالاتر بلکول و روبین انویدیا را به چالش میکشد.
به گزارش سرویس سخت افزار تکناک، شرکت آمریکایی تنسورداین که در زمینه هوش مصنوعی فعالیت میکند، از پایان موفقیتآمیز مراحل طراحی نهایی و آمادهسازی برای تولید تراشه نیپیر خبر داده است؛ تراشهای که ادعا میشود با ارائه نرخ پردازش توکن و کارایی بینظیر، تراشههای بلکول و روبین انویدیا را به چالش میکشد. تراشه جدید هوش مصنوعی نیپیر تنسورداین با یک هدف واضح معرفی شده است: اینکه عملکرد تراشههای بلکول و روبین انویدیا را به میزان چشمگیری کمفروغتر جلوه دهد.
تراشه نیپیر هسته اصلی سیستم تنسورداین نیپیر تیدیان خواهد بود که با همکاری برادکام و اچپیئی جونیپر نتورکز طراحی شده است. پلتفرم نیپیر یک هدف را دنبال میکند؛ یکپارچهسازی هوش مصنوعی از طریق محاسبات ریاضی لگاریتمی نوین، معماری حافظه بهشدت منسجم و یک اتصال داخلی مقیاسپذیر با عملکرد بالا که نرخ پردازش توکن بالاتری را با مصرف انرژی کم ارائه میدهد.

تراشه نیپیر بر پایه فرآیند ۳ نانومتری تیاسامسی ساخته شده و با پشت سر گذاشتن موفقیتآمیز مرحله طراحی نهایی، اکنون وارد فاز تولید شده است. با دستیابی به این هدف اولیه مهم، تنسورداین در حال حاضر برای راهاندازی نسخه بتا و برنامهریزی یک زیرساخت گستردهتر تلاش میکند که نشاندهنده تقاضای پیشبینیشدهای بالغ بر ۲۰۰ میلیون دلار برای سیستمهای نیپیر است. تمرکز اصلی این پروژه بر روی استنتاج هوش مصنوعی قرار دارد.
این تراشه دارای ۱۳۸ میلیارد ترانزیستور است و با ۱۴۴ گیگابایت حافظه HBM3E، ۲۵۶ مگابایت حافظه SRAM و توان پردازشی ۲.۱ پتافلاپس در اوج محاسبات هوش مصنوعی با فرمت متراکم FP8 ارائه میشود. توان طراحی حرارتی این تراشه نیز ۳۰۰ وات است.
پیش از این درباره اینکه زیرساختهای فعلی هوش مصنوعی با محدودیت مصرف انرژی مواجه هستند بحث شده بود، اما برای مقابله با این محدودیتها، راهکارهایی مانند برق مستقیم ۸۰۰ ولت هزینههای استقرار بسیار سنگینی را به همراه خواهند داشت. زیرساختهایی مانند برق و سیستمهای خنککننده به تنهایی ۵۰ درصد از هزینه پروژههای بزرگ هوش مصنوعی را به خود اختصاص میدهند. برای حل این مشکل، تنسورداین یک مجموعه استنتاج جدید در بخشهای ریاضیات، محاسبات، حافظه و شبکه ارائه کرده است.
ریاضیات تیدیان یا همان محاسبات لگاریتمی، عملیات ضرب در مقیاس بزرگ را با محاسبات سادهتر مبتنی بر جمع جایگزین میکند و به این ترتیب کارایی عملکرد نسبت به وات را در مدلهای پیشرو هوش مصنوعی به طور چشمگیری بهبود میبخشد.

پردازنده هوش مصنوعی تیدیان نیز به گونهای طراحی شده که در هر پردازنده، مقدار زیادی حافظه سریع SRAM در کنار حافظه HBM به طور منسجم قرار گرفته است. این ساختار چرخههای بیکار پردازش را به حداقل میرساند و اجرای کارآمد بزرگترین مدلهای صنعت را ممکن میسازد.
رابط اتصال مقیاسپذیر همهبههمه یا لینک تیدیان، با بهرهگیری از شبکه اختصاصی تنسورداین، تاخیر ارتباطی بین پردازندهها را به زیر میکروثانیه میرساند و با این کار، بهرهوری محاسباتی را به حداکثر رسانده و گلوگاههای ارتباطی را به حداقل کاهش میدهد.
همه این ویژگیها در سیستم رک و پاد استنتاج تیدیان ۷۲ تنسورداین گرد هم آمدهاند. هر پاد به ۷۲ تراشه هوش مصنوعی نیپیر مجهز است که از این نظر به رکهای NVL72 انویدیا با ۷۲ پردازنده گرافیکی بلکول یا روبین شباهت دارد. این سیستم به ظرفیت زیرساختی بسیار کمتری نیاز دارد و یک رک نیپیر با ترکیب چهار پاد تیدیان ۷۲، ویژگیهای زیر را ارائه میدهد:
۱۷ برابر توکن بیشتر به ازای هر وات در مقایسه با بلکول انویدیا، ۱۳ برابر توکن بیشتر در هر ثانیه در مقایسه با بلکول انویدیا و تا ۳۳ میلیون دلار درآمد سالانه بیشتر به ازای هر رک.
مقایسه میان بلکول NVL72 GB300 انویدیا و نیپیر تیدیان ۷۲ تنسورداین نشاندهنده برتری عملکرد محصول تنسورداین است؛ به طوری که ارائهدهنده عملکردی مشابه در ابعادی ۴ برابر کوچکتر و با مصرف انرژی ۵ برابر کمتر است.



در اسلایدهای معرفی سیستم تنسورداین نیپیر تیدیان، یک رک تیدیان شامل ۴ پاد تیدیان ۷۲ به همراه مشخصات فنی آن، در کنار یک پاد تیدیان ۷۲ با ۷۲ تراشه پردازنده هوش مصنوعی تیدیان نمایش داده شده که در آن اجزایی مانند محاسبات ریاضی لگاریتمی، پردازنده هوش مصنوعی، سینی محاسبات هوش مصنوعی و رابط اتصال مقیاسپذیر برجسته شدهاند.
جدول مقایسهای مربوط به مدلهای دو تریلیون پارامتری نیز سیستمهای تنسورداین، انویدیا، گروک، آمازون و سربرس را با آمارهای کلیدی از جمله مدلهای هوش مصنوعی، توکن در ثانیه، قیمت به ازای هر میلیون توکن، تعداد رکها و میزان مصرف انرژی مقایسه کرده است.
سرورهای نیپیر مجهز به ۷۲ تراشه، ظرفیت حافظه HBM معادل ۱۰ ترابایت را ارائه خواهند داد و میتوانند مدلهایی تا ۱۰ تریلیون پارامتر را با فرمت FP4 پشتیبانی کنند. یک رک کامل با سیستم خنککننده بادی در مجموع شامل ۲۸۸ تراشه (۷۲ تراشه در هر سرور) خواهد بود که توان پردازشی ۶۰۸ پتافلاپس در حالت FP8، حافظه SRAM معادل ۷۴ گیگابایت، حافظه HBM3e معادل ۴۲ ترابایت و توان مصرفی نامی ۱۲۰ کیلووات را ارائه میدهد.
تنسورداین مقایسههای خود را تنها به بلکول محدود نکرده و راهکار نیپیر را با پلتفرم آینده روبین انویدیا نیز مقایسه کرده است. این شرکت ادعا میکند که پلتفرم آن از مدلهای چند تریلیون پارامتری با نرخ پردازش ۱۰۰۰ توکن در ثانیه برای هر کاربر در یک پیکربندی تکرک پشتیبانی میکند. برای دستیابی به همین سطح از عملکرد، انویدیا به ۹ رک ترکیبی از روبین و گروک نیاز خواهد داشت.
تصاویر منتشرشده یک رک سرور مشکیرنگ با لوگوی تنسورداین در بخش جلویی را در پسزمینهای طیفرنگ نشان میدهند.

به نوشته Wccftech، پلتفرم نیپیر تنسورداین نشاندهنده جهشی بزرگ در استنتاج هوش مصنوعی است. این سیستم با ارائه ۱۷ برابر توکن بیشتر به ازای هر وات و ۱۳ برابر نرخ پردازش بالاتر نسبت به بلکول انویدیا، در حالی که عملکرد ۹ رک مبتنی بر روبین را در یک فضای فشرده و واحد ارائه میدهد، مرزهای سنتی میان سرعت در برابر هزینه و توان در برابر عملکرد را جابهجا کرده است.
نیپیر با نیازهای زیرساختی بسیار کمتر، ایجاد تا ۳۳ میلیون دلار درآمد سالانه بیشتر به ازای هر رک و مقیاسپذیری کارآمد برای مدلهای چند تریلیون پارامتری، نه تنها با تراشههای بلکول و روبین انویدیا رقابت میکند، بلکه استانداردهای جدیدی را برای نسل بعدی توسعه هوش مصنوعی تعریف میکند.

















