تراشههای Trainium2 آمازون برای ساخت مدلهای زبانی بزرگ (LLM) اکنون به صورت عمومی در دسترس هستند و نسل بعدی آن، Trainium3، قرار است اواخر سال ۲۰۲۵ عرضه شود.
به گزارش تکناک، این تراشهها که به طور خاص برای آموزش مدلهای هوش مصنوعی طراحی شدهاند، عملکرد بسیار بالایی دارند و به توسعهدهندگان امکان میدهند تا مدلهای بزرگ و پیچیدهتری را در زمان کوتاهتری آموزش دهند.
این تراشهها که برای اولین بار یک سال پیش معرفی شدند، نسبت به نسل قبلی خود چهار برابر سریعتر هستند. به گفته شرکت آمازون هر نمونه EC2 که از ۱۶ تراشه T2 استفاده کند، میتواند تا ۲۰.۸ پتافلاپس توان پردازشی ارائه دهد.
تککرانچ مینویسد که این بهبودها به معنای بهرهوری بیشتر در پردازش مدلهای زبانی بزرگ مانند مدل Llama 405B متا در پلتفرم Bedrock LLM است.
شرکت آمازون اعلام کرده است که این تراشهها میتوانند «۳ برابر بازده بیشتری در تولید توکن نسبت به سایر سرویسدهندگان ابری بزرگ» ارائه کنند.
فهرست مطالب
معرفی UltraServers با عملکرد فوقالعاده
تراشههای Trainium2 در سرورهایی با نام EC2 Trn2 UltraServers نیز به کار گرفته میشوند. این سرورها دارای ۶۴ تراشه Trainium2 متصل به هم هستند و توانایی ارائه حداکثر ۸۳.۲ پتافلاپس توان پردازشی را در اوج دارند.
بر اساس اعلام شرکت آمازون، توان پردازشی ۲۰.۸ پتافلاپس برای مدلهای متراکم با دقت FP8 در نظر گرفته شده و مقدار ۸۳.۲ پتافلاپس مربوط به مدلهای پراکنده با همین دقت است.
همچنین آمازون با شرکت Anthropic، یکی از تأمینکنندگان اصلی مدلهای زبانی بزرگ، همکاری میکند تا یک خوشه عظیم از این سرورها با «صدها هزار تراشه Trainium2» ایجاد کند.
به گفته شرکت آمازون، این خوشه جدید از نظر توان پردازشی ۵ برابر قدرتمندتر از خوشهای است که Anthropic برای آموزش مدلهای نسل فعلی خود استفاده کرده است.
همچنین شرکت آمازون تأکید کرده است که این خوشه «بزرگترین خوشه محاسباتی هوش مصنوعی در جهان تا به امروز» خواهد بود.
مقایسه با انویدیا و Blackwell
تراشههای جدید Trainium2 از بسیاری جهات نسبت به نسل فعلی GPUهای انویدیا بهبود یافتهتر هستند.
با وجود این، انویدیا وعده داده است که تراشههای نسل بعدی Blackwell که اوایل سال آینده عرضه میشوند، توان پردازشی بسیار بالاتری خواهند داشت.
بر اساس گزارشها، تراشههای Blackwell میتوانند تا ۷۲۰ پتافلاپس عملکرد FP8 را در یک رک شامل 72 GPU ارائه دهند.
معرفی تراشههای نسل بعدی Trainium3
شرکت آمازون در همین کنفرانس سالانه re:Invent، تراشههای نسل بعدی خود با نام Trainium3 را نیز معرفی کرد.
این تراشهها که قرار است اواخر سال ۲۰۲۵ عرضه شوند، بر اساس فرایند تولید ۳ نانومتری ساخته خواهند شد و انتظار میرود که عملکرد آنها نسبت به Trainium2 چهار برابر افزایش یابد.
همچنین شرکت آمازون اعلام کرد که تراشههای Trainium3 را در UltraServers جدید خود به کار خواهد گرفت.
دیوید براون، معاون بخش محاسبات و شبکه شرکت آمازون، در این باره گفت:
«Trainium2 بهترین تراشه شرکت آمازون است که تا به امروز ساخته شده است. با مدلهایی که به تریلیونها پارامتر نزدیک میشوند، مشتریان به راهکارهای نوین برای آموزش و اجرای این مدلهای عظیم نیاز دارند. سرورهای Trn2 UltraServers بالاترین سرعت آموزش و استنتاج را برای بزرگترین مدلهای جهان در شرکت آمازون ارائه میدهند. با نسل سوم تراشههای Trainium3، ما به مشتریان کمک میکنیم که مدلهای بزرگتر را سریعتر بسازند و عملکرد بالایی در زمان واقعی ارائه دهند.»
این پیشرفتها نشاندهنده تعهد شرکت آمازون به توسعه فناوریهای پیشرفته برای مدلهای زبانی بزرگ است و رقابت این شرکت با انویدیا را وارد مرحله جدیدی میکند.