مایکروسافت تراشهای جدید به نام Maia 100 ساخته است که بهمنظور انجام محاسبات پیچیدهی موردنیاز برای هوش مصنوعی بهینه شده است.
بهگزارش تکناک، در رویداد Ignite 2023، مایکروسافت برای اولینبار اعلام کرد که تراشهی شتابدهنده هوش مصنوعی خود به نام مایا (Maia) را توسعه داده است. اوایل امسال و در کنفرانس توسعهدهندگان Build، مایکروسافت جزئیات بیشتری از Azure Maia 100 بهاشتراک گذاشت. Maia 100 یکی از پردازندههای بزرگی است که با لیتوگرافی ۵ نانومتری TSMC ساخته و بهطور خاص برای کارهای بزرگ مقیاس هوش مصنوعی مستقر در Azure طراحی شده است.
نئووین مینویسد که در کنفرانس Hot Chips 2024، مایکروسافت برای اولینبار مشخصات Maia 100 را بهاشتراک گذاشت و جزئیات بیشتری از آن فاش کرد.
فهرست مطالب
مشخصات Maia 100
- اندازهی تراشه: ۸۲۰ میلیمترمربع
- بستهبندی: لیتوگرافی TSMC N5 با فناوری اینترپوزر COWOS-S
- پهنای باند/ظرفیت: ۱/۸ ترابایتبرثانیه در ۶۴ گیگابایت HBM2E
- اوج توان محاسباتی متراکم تنسور: ۶ بیت: ۳، ۹ بیت: ۱.۵، BF16: ۰.۸
- L1/L2 پانصد مگابایت
- پهنای باند شبکهی بکاند: ۶۰۰ گیگابایتبرثانیه (12X400gbe)
- پهنای باند میزبان (PCIe): ۳۲ گیگابایتبرثانیه PCIe Gen5X8
- طراحی به TDP: هفتصد وات
- TDP تأمینشده: ۵۰۰ وات
Maia 100 مایکروسافت با معماری عمودی یکپارچه شامل بردهای سرور سفارشی و رکهای طراحیشدهی اختصاصی و استک نرمافزاری بهینه شده است. این طراحی هزینهها را کاهش داده و عملکرد سیستم را بهبود درخورتوجهی بخشیده است.
معماری Maia 100
Maia 100 از شبکهی اترنت سفارشی با پروتکلی مشابه RoCE برای دستیابی به پهنای باند گسترده در محاسبات بهره میبرد. این سیستم میتواند پهنای باند all-gather و scatter-reduced حداکثر ۴۸۰۰ گیگابیتبرثانیه و پهنای باند all-to-all حداکثر ۱۲۰۰ گیگابیتبرثانیه ارائه دهد.
کیت توسعهی نرمافزار (SDK) مایا امکان انتقال سریع مدلهای PyTorch و Triton به پلتفرم آن را فراهم میکند. این SDK شامل مجموعه کاملی از ابزارها و کتابخانهها است که به توسعهدهندگان اجازه میدهد تا مدلهای خود را بهسادگی در سرویسهای Azure OpenAI مستقر کنند و از زیرساخت قدرتمند Maia بهرهمند شوند.
توسعهدهندگان برای برنامهنویسی سیستم Maia دو گزینه پیش رو دارند. آنها میتوانند از زبان برنامهنویسی خاص دامنه (DSL) محبوب Triton برای شبکههای عصبی عمیق یا از API اختصاصی Maia بهره ببرند. API مایا امکان کنترل دقیقتر روی سیستم را برای توسعهدهندگان فراهم میکند و عملکرد بهینهای ارائه میدهد.
علاوهبراین، Maia از مدلهای PyTorch بهصورت بومی پشتیبانی میکند. این یعنی توسعهدهندگان میتوانند با تغییراتی جزئی در کدهای PyTorch خود، از قابلیتهای قدرتمند این سیستم بهرهمند شوند.
Maia 100 با معماری پیشرفته و ابزارهای قدرتمند توسعه و یکپارچگی عمیق با آژور، رویکرد مایکروسافت را در مدیریت و اجرای کارهای سنگین هوش مصنوعی متحول کرده است.
بااینحال، این پرسش همچنان مطرح است که مایکروسافت مانند گوگل با TPUها و آمازون با تراشههای Trainium و Inferentia، دسترسی به شتابدهندههای قدرتمند مایا ۱۰۰ را برای توسعهدهندگان مستقل نیز فراهم خواهد کرد یا خیر.