آمازون دو تراشه هوش مصنوعی جدید رونمایی کرد

آمازون در رویداد re:Invent 2023 دو تراشه هوش مصنوعی جدید و بسیار قدرتمند به نام های AWS Trainium2 و Graviton4 را رونمایی کرد.

به‌گزارش تک‌ناک، تقاضا برای هوش مصنوعی که اغلب روی واحدهای پردازش گرافیکی (GPU) آموزش داده و اجرا می‌شود، در حال افزایش است. بااین‌حال، کمبود در دسترسی به تراشه هوش مصنوعی احساس می‌شود. گزارش شده است که بهترین تراشه‌های انویدیا تا سال 2024 فروخته شده‌اند. دراین‌میان، حتی مدیرعامل TSMC نیز اظهار کرده است که این کمبود احتمال دارد تا سال 2025 ادامه یابد. این مشکل تنها به انویدیا محدود نیست؛ بلکه رقبایش نیز با آن روبه‌رو هستند.

در پاسخ به این مشکل، شرکت‌های بزرگ فناوری در حال ساخت تراشه‌های سفارشی طراحی‌شده برای تولید و بهینه‌سازی مدل‌های هوش مصنوعی هستند. یکی از این شرکت‌ها آمازون است که در کنفرانس سالانه‌ی خود، یعنی re:Invent 2023، نسل جدید تراشه‌های خود را برای آموزش و اجرای مدل‌های هوش مصنوعی رونمایی کرده است.

به‌گزارش تک‌کرانچ، اولین تراشه‌ هوش مصنوعی آمازون AWS Trainium2 نام دارد و با این هدف طراحی شده است تا درمقایسه‌با نسل اول Trainium که در دسامبر‌2020 معرفی شده بود، بهبود عملکرد حداکثر چهاربرابری و بهره‌وری انرژی حداکثر دوبرابری را ارائه دهد.

آمازون اعلام کرده است که Trainium2 در نمونه‌های EC2 Trn2 در خوشه‌های 16 تراشه در محیط ابری AWS دردسترس خواهد بود و این تراشه می‌تواند در محصول EC2 UltraCluster شرکت AWS تا 100,000 تراشه افزایش یابد.

غول فناوری آمریکایی اعلام کرده است که 100,000 تراشه Trainium می‌تواند 65 اگزافلاپس توان محاسباتی ارائه دهد که معادل 650 ترافلاپس برای هر تراشه‌ی تکی است. اگزافلاپس و ترافلاپس واحدهای اندازه‌گیری هستند که تعداد عملیات محاسباتی را می‌سنجند که تراشه در هر ثانیه می‌تواند انجام دهد.

با در‌نظر‌گرفتن پیچیدگی‌های فنی موجود، این محاسبات سریع ممکن است دقیق نباشند. با‌این حال، اگر تراشه‌ی تکی Trainium2 واقعاً بتواند عملکردی درحدود 200 ترافلاپس ارائه دهد، این عملکرد به‌مراتب بیشتر از تراشه‌های سفارشی آموزش هوش مصنوعی گوگل در‌حدود سال 2017 است.

آمازون می‌گوید که یک خوشه از 100,000 تراشه Trainium می‌تواند یک مدل زبان بزرگ هوش مصنوعی با 300 میلیارد پارامتر را در چند هفته به‌جای چند ماه آموزش دهد. پارامترها بخش‌هایی از یک مدل هستند که از داده‌های آموزشی یاد گرفته می‌شوند و توانایی مدل در حل مشکلاتی مانند تولید متن یا کد را تعریف می‌کنند. این اندازه تقریباً 1.75 برابر بزرگ‌تر از GPT-3 OpenAI است که یکی از مدل‌های پیشین مولد متن GPT-4 به‌حساب می‌آید.

دیوید براون، معاون بخش کامپیوت و شبکه در AWS، در بیانیه‌ای مطبوعاتی اظهار کرد:

سیلیکون هر بار نقش مهمی در پشتیبانی از کارهای مشتریان ایفا می‌کند. این امر آن را به حوزه‌ی حیاتی نوآوری برای AWS تبدیل می‌کند. با رشد علاقه به هوش مصنوعی تولیدی، Tranium2 به مشتریان کمک می‌کند تا مدل‌های یادگیری ماشینی خود را سریع‌تر و با هزینه‌ی کمتر و بهره‌وری انرژی بیشتر آموزش دهند.

آمازون زمان دقیقی برای عرضه‌ی نمونه‌های Trainium2 اعلام نکرده است.

دومین تراشه‌ هوش مصنوعی آمازون Graviton4 نام دارد که مبتنی‌بر Arm است و برای اجرای مدل‌های استنتاج (Inference) طراحی شده است. این نسل چهارم از خانواده‌ی تراشه‌های Graviton Amazon است که با افزودن «4» به Graviton متمایز می‌شود و متفاوت از تراشه‌ی استنتاج دیگری از آمازون، یعنی Inferentia، است.

آمازون ادعا می‌کند که تراشه‌ی Graviton4 درمقایسه‌با تراشه‌ی نسل قبلی Graviton، یعنی Graviton3 که روی Amazon EC2 اجرا می‌شود، تا 30درصد افزایش عملکرد محاسباتی و 50درصد هسته‌های بیشتر و 75درصد افزایش پهنای باند حافظه را ارائه می‌دهد.

در تغییری دیگر درمقایسه‌با Graviton3، آمازون می‌گوید که تمام رابط‌های سخت‌افزاری فیزیکی Graviton4 رمزگذاری شده‌اند. این اتفاق ظاهراً امنیت بیشتری برای بارهای کاری آموزش هوش مصنوعی و داده‌ها فراهم می‌کند؛ به‌ویژه برای مشتریانی که نیازهای روزافزون رمزنگاری دارند.

دیوید براون درادامه افزود:

Graviton4 نشان‌دهنده‌ی نسل چهارمی است که تنها در پنج سال عرضه کرده‌ایم و قدرتمندترین و کارآمدترین تراشه‌ای است که تا‌به‌امروز برای طیف وسیعی از بارهای کاری ساخته‌ایم. با تمرکز بر طراحی تراشه‌های ما بر‌اساس بارهای کاری واقعی که برای مشتریان مهم هستند، می‌توانیم زیرساخت‌های ابری پیشرفته‌تری به آن‌ها ارائه دهیم.

تراشه‌ی Graviton4 در نمونه‌های Amazon EC2 R8g در‌دسترس خواهد بود که از امروز در نسخه‌ی پیش‌نمایش موجود است و عرضه‌ی عمومی آن در ماه‌های آینده برنامه‌ریزی شده است.