ایلان ماسک، مالک تسلا و شبکه اجتماعی ایکس، ابرکامپیوتر جدید xAI Colossus را با ۱۰۰ هزار پردازندهی گرافیکی (GPU) رونمایی کرد.
بهگزارش تکناک، ایلان ماسک، مدیرعامل شرکت xAI، از پروژه جدید و گرانقیمت خود به نام ابرکامپیوتر هوش مصنوعی xAI Colossus پردهبرداری کرده است. این ابرکامپیوتر که بهتازگی جزئیات آن منتشر شده، بهعنوان بزرگترین خوشه هوش مصنوعی جهان معرفی میشود و به آموزش مدلهای پیچیده هوش مصنوعی شرکت ایکس اختصاص یافته است.
تامزهاردور مینویسد که یکی از کاربران یوتیوب با نام ServeTheHome برای اولینبار به سرورهای Supermicro این هیولای هوش مصنوعی با بیش از ۱۰۰ هزار واحد GPU دسترسی یافته و اطلاعات متعددی از ساختار آن منتشر کرده است. این ابرکامپیوترها تقریباً دو ماه است که آنلاین شده و فرایند مونتاژ آن پس از ۱۲۲ روز به اتمام رسیده است.
فهرست مطالب
جزئیات فنی؛ شبکهسازی، خنکسازی و سیستم تأمین انرژی
ابرخوشه Colossus شامل قفسههایی است که در گروههای هشتتایی قرار دارند و هر آرایه ۵۱۲ واحد GPU دارد. برای هر سرور چهار منبع تغذیه پشتیبان در نظر گرفته شده و قسمت پشتی قفسهها مجهز به منابع تغذیه سهفاز و سوئیچهای Ethernet و سیستم خنککننده مایع گسترده است. این خوشه متشکل از بیش از ۱,۵۰۰ قفسه GPU است که نزدیک به ۲۰۰ آرایه قفسهای را تشکیل میدهد. بهگفته جنسن هوانگ، مدیرعامل انویدیا، این GPUها فقط در مدت سه هفته نصب شدهاند.
بهدلیل نیاز پهنای باند گسترده برای خوشههای هوش مصنوعی که بهطور مداوم مدلهای خود را آموزش میدهند، xAI از اتصالات شبکهای بسیار پیشرفته استفاده میکند. هر کارت گرافیکی یک NIC (کنترلر رابط شبکه) اختصاصی با سرعت 400GbE دارد. همچنین، به یک NIC اضافی 400Gb برای هر سرور مجهز است که ظرفیت اترنت هر سرور HGX H100 را به ۳/۶ ترابیتبرثانیه میرساند. برخلاف اکثر ابرکامپیوترهای دیگر که از اتصالات خاص مانند InfiniBand بهره میبرند، این خوشه بهطور کامل به Ethernet متکی است.
همچنین، برای تغذیه این ابرکامپیوتر از باتریهای Tesla Megapack استفاده شده است. بهدلیل ماهیت روشن و خاموش سریع این خوشه و میلیثانیههایی از تأخیر میان بانکها، فشار زیادی به شبکه برق و ژنراتورهای دیزلی ماسک وارد میشود. ازاینرو، باتریهای Megapack بهعنوان واسطه انرژی بین شبکه برق و ابررایانه قرار گرفتهاند تا از قطعیهای احتمالی جلوگیری کنند.
کاربرد Colossus و آینده ابررایانههای ماسک
بهگفته انویدیا، ابرکامپیوتر xAI Colossus درحالحاضر بزرگترین ابرکامپیوتر هوش مصنوعی جهان محسوب میشود. برخلاف سایر ابرکامپیوترهای جهانی که به تحقیقات عمومی و مطالعات علمی اختصاص دارند، ابرکامپیوتر xAI Colossus بهطور انحصاری برای آموزش مدلهای هوش مصنوعی x کاربرد دارد. این ابرکامپیوتر روی مدلهایی مانند چتبات Grok 3 متمرکز است؛ چتباتی که ماسک آن را «ضد جریان غالب» توصیف کرده و در انحصار کاربران X Premium قرار داده است.
همچنین براساس گزارشها، این خوشه در حال آموزش مدلهای هوش مصنوعی پیچیدهتری است که کاربردها و تواناییهای آنها فراتر از فناوریهای هوش مصنوعی امروزی خواهد بود.
فازهای بعدی و افزایش ظرفیت پردازشی
فاز اول ساخت ابرکامپیوتر xAI Colossus بهاتمام رسیده و خوشه بهطور کامل آنلاین است؛ اما بهروزرسانیها بهپایان نرسیدهاند. بهزودی، ابرکامپیوتر Memphis بهمنظور افزایش ظرفیت GPU خود تا دو برابر، با ۵۰ هزار واحد H100 و ۵۰ هزار واحد H200 نسل بعدی ارتقا خواهد یافت. این ارتقا مصرف برق خوشه را نیز به بیش از دو برابر افزایش خواهد داد که برای ۱۴ ژنراتور دیزلی ماسک که در ماه ژوئیه به سایت اضافه شدهاند، چالشبرانگیز خواهد بود.
این افزایش همچنان با وعده ماسک مبنیبر قرارگیری ۳۰۰ هزار واحد H200 در این خوشه فاصله دارد؛ اما ممکن است در فاز سوم ساخت به آن دست یابد. علاوهبر ابرکامپیوتر xAI Colossus، ماسک از پروژههای دیگری نیز برای توسعه هوش مصنوعی بهره میبرد. ابرکامپیوتر Cortex با ۵۰ هزار GPU در کارخانه گیگا تگزاس تسلا، برای آموزش فناوری خودران تسلا و سایر پروژههای هوش مصنوعی طراحی شده است و پروژه ساخت ابرکامپیوتر Dojo نیز با بودجه ۵۰۰ میلیون دلاری در بوفالو نیویورک در دستورکار قرار دارد.
با پیشبینیهایی مانند اظهارنظر مدیرعامل بایدو، رابین لی، مبنیبر اینکه با ترکیدن حباب هوش مصنوعی ۹۹ درصد شرکتهای فعال در این حوزه نابود خواهند شد، مشخص نیست که آیا سرمایهگذاری گسترده ایلان ماسک در این زمینه نتیجه مطلوب خواهد داشت یا خیر.
دیدگاهها 1