آمازون در رویداد re:Invent 2023 دو تراشه هوش مصنوعی جدید و بسیار قدرتمند به نام های AWS Trainium2 و Graviton4 را رونمایی کرد.
بهگزارش تکناک، تقاضا برای هوش مصنوعی که اغلب روی واحدهای پردازش گرافیکی (GPU) آموزش داده و اجرا میشود، در حال افزایش است. بااینحال، کمبود در دسترسی به تراشه هوش مصنوعی احساس میشود. گزارش شده است که بهترین تراشههای انویدیا تا سال 2024 فروخته شدهاند. دراینمیان، حتی مدیرعامل TSMC نیز اظهار کرده است که این کمبود احتمال دارد تا سال 2025 ادامه یابد. این مشکل تنها به انویدیا محدود نیست؛ بلکه رقبایش نیز با آن روبهرو هستند.
در پاسخ به این مشکل، شرکتهای بزرگ فناوری در حال ساخت تراشههای سفارشی طراحیشده برای تولید و بهینهسازی مدلهای هوش مصنوعی هستند. یکی از این شرکتها آمازون است که در کنفرانس سالانهی خود، یعنی re:Invent 2023، نسل جدید تراشههای خود را برای آموزش و اجرای مدلهای هوش مصنوعی رونمایی کرده است.
بهگزارش تککرانچ، اولین تراشه هوش مصنوعی آمازون AWS Trainium2 نام دارد و با این هدف طراحی شده است تا درمقایسهبا نسل اول Trainium که در دسامبر2020 معرفی شده بود، بهبود عملکرد حداکثر چهاربرابری و بهرهوری انرژی حداکثر دوبرابری را ارائه دهد.
آمازون اعلام کرده است که Trainium2 در نمونههای EC2 Trn2 در خوشههای 16 تراشه در محیط ابری AWS دردسترس خواهد بود و این تراشه میتواند در محصول EC2 UltraCluster شرکت AWS تا 100,000 تراشه افزایش یابد.
غول فناوری آمریکایی اعلام کرده است که 100,000 تراشه Trainium میتواند 65 اگزافلاپس توان محاسباتی ارائه دهد که معادل 650 ترافلاپس برای هر تراشهی تکی است. اگزافلاپس و ترافلاپس واحدهای اندازهگیری هستند که تعداد عملیات محاسباتی را میسنجند که تراشه در هر ثانیه میتواند انجام دهد.
با درنظرگرفتن پیچیدگیهای فنی موجود، این محاسبات سریع ممکن است دقیق نباشند. بااین حال، اگر تراشهی تکی Trainium2 واقعاً بتواند عملکردی درحدود 200 ترافلاپس ارائه دهد، این عملکرد بهمراتب بیشتر از تراشههای سفارشی آموزش هوش مصنوعی گوگل درحدود سال 2017 است.
آمازون میگوید که یک خوشه از 100,000 تراشه Trainium میتواند یک مدل زبان بزرگ هوش مصنوعی با 300 میلیارد پارامتر را در چند هفته بهجای چند ماه آموزش دهد. پارامترها بخشهایی از یک مدل هستند که از دادههای آموزشی یاد گرفته میشوند و توانایی مدل در حل مشکلاتی مانند تولید متن یا کد را تعریف میکنند. این اندازه تقریباً 1.75 برابر بزرگتر از GPT-3 OpenAI است که یکی از مدلهای پیشین مولد متن GPT-4 بهحساب میآید.
دیوید براون، معاون بخش کامپیوت و شبکه در AWS، در بیانیهای مطبوعاتی اظهار کرد:
سیلیکون هر بار نقش مهمی در پشتیبانی از کارهای مشتریان ایفا میکند. این امر آن را به حوزهی حیاتی نوآوری برای AWS تبدیل میکند. با رشد علاقه به هوش مصنوعی تولیدی، Tranium2 به مشتریان کمک میکند تا مدلهای یادگیری ماشینی خود را سریعتر و با هزینهی کمتر و بهرهوری انرژی بیشتر آموزش دهند.
آمازون زمان دقیقی برای عرضهی نمونههای Trainium2 اعلام نکرده است.
دومین تراشه هوش مصنوعی آمازون Graviton4 نام دارد که مبتنیبر Arm است و برای اجرای مدلهای استنتاج (Inference) طراحی شده است. این نسل چهارم از خانوادهی تراشههای Graviton Amazon است که با افزودن «4» به Graviton متمایز میشود و متفاوت از تراشهی استنتاج دیگری از آمازون، یعنی Inferentia، است.
آمازون ادعا میکند که تراشهی Graviton4 درمقایسهبا تراشهی نسل قبلی Graviton، یعنی Graviton3 که روی Amazon EC2 اجرا میشود، تا 30درصد افزایش عملکرد محاسباتی و 50درصد هستههای بیشتر و 75درصد افزایش پهنای باند حافظه را ارائه میدهد.
در تغییری دیگر درمقایسهبا Graviton3، آمازون میگوید که تمام رابطهای سختافزاری فیزیکی Graviton4 رمزگذاری شدهاند. این اتفاق ظاهراً امنیت بیشتری برای بارهای کاری آموزش هوش مصنوعی و دادهها فراهم میکند؛ بهویژه برای مشتریانی که نیازهای روزافزون رمزنگاری دارند.
دیوید براون درادامه افزود:
Graviton4 نشاندهندهی نسل چهارمی است که تنها در پنج سال عرضه کردهایم و قدرتمندترین و کارآمدترین تراشهای است که تابهامروز برای طیف وسیعی از بارهای کاری ساختهایم. با تمرکز بر طراحی تراشههای ما براساس بارهای کاری واقعی که برای مشتریان مهم هستند، میتوانیم زیرساختهای ابری پیشرفتهتری به آنها ارائه دهیم.
تراشهی Graviton4 در نمونههای Amazon EC2 R8g دردسترس خواهد بود که از امروز در نسخهی پیشنمایش موجود است و عرضهی عمومی آن در ماههای آینده برنامهریزی شده است.