انویدیا با سرورهای GB200 بلک‌ول، عملکرد هوش مصنوعی را ۱۰ برابر سریع‌تر کرد

سرورهای GB200 بلک‌ول انویدیا با طراحی مشترک سخت‌افزار و نرم‌افزار، مدل‌های MoE را تا ۱۰ برابر سریع‌تر اجرا می‌کنند.

به گزارش سرویس سخت‌افزار تک‌ناک، انویدیا امروز از دستاوردی بزرگ در‌زمینه پردازش هوش مصنوعی پرده‌برداری کرد. این شرکت اعلام کرد که با استفاده از سرورهای جدید GB200 بلک‌ول NVL72 خود، توانسته است عملکرد مدل‌های هوش مصنوعی MoE را تا ۱۰ برابر افزایش دهد. این پیشرفت که حاصل رویکرد نوآورانه «طراحی مشترک» است، یکی از موانع محاسباتی بزرگ در مسیر مقیاس‌پذیری این مدل‌های پیشرفته را از میان برمی‌دارد.

مدل‌های هوش مصنوعی MoE به‌دلیل بهینگی محاسباتی، به‌سرعت درحال تبدیل‌شدن به استانداردی مهم در دنیای هوش مصنوعی هستند. این مدل‌ها برخلاف مدل‌های زبان بزرگ سنتی که برای هر پرس‌وجو تمام پارامترهای خود را فعال می‌کنند، تنها بخش کوچکی از «متخصصان» خود را متناسب با نوع درخواست به کار می‌گیرند. با‌این‌حال، افزایش مقیاس و بزرگ‌تر‌کردن این مدل‌ها همواره با گلوگاه محاسباتی بزرگی همراه بوده است که از بهره‌برداری کامل از پتانسیل آن‌ها مانع می‌شد.

انویدیا در بیانیه مطبوعاتی خود فاش کرد که برای نمایش این قابلیت، عملکرد خوشه هوش مصنوعی GB200 NVL72 را روی مدل زبان بزرگ منبع‌باز Kimi K2 Thinking آزموده است. این مدل که ۳۲ میلیارد پارامتر فعال دارد، گزینه‌ای برجسته در حوزه MoE محسوب می‌شود. نتایج نشان داد که معماری جدید بلک‌ول در مقایسه با نسل قبلی، یعنی سرورهای Hopper HGX 200، عملکردی ۱۰ برابر سریع‌تر ارائه می‌دهد. به گفته تیم سبز، معماری بلک‌ول کاملاً برای بهره‌برداری از ظهور مدل‌های پیش‌گام MoE آماده شده است.

نمودار مقایسه‌ای که پیشرفت ۱۰ برابری عملکرد سرور GB200 نسبت به H200 را نشان می‌دهد.

راز این موفقیت در رویکرد «طراحی مشترک» انویدیا نهفته است. این شرکت با بهینه‌سازی هم‌زمان سخت‌افزار و نرم‌افزار، توانسته است بر محدودیت‌های ارتباطی غلبه کند. پیکربندی GB200 با ۷۲ تراشه و ۳۰ ترابایت حافظه سریع مشترک، امکان موازی‌سازی تخصصی را در سطحی بی‌سابقه فراهم می‌کند. این ساختار تضمین می‌کند که دسته‌های توکن به‌طور مداوم و بهینه میان پردازنده‌های گرافیکی تقسیم شوند و حجم ارتباطات غیرضروری کاهش یابد.

علاوه‌بر این، بهینه‌سازی‌های نرم‌افزاری نیز نقشی مهمی در این دستاورد ایفا کرده‌اند:

چهارچوب Dynamo انویدیا: با تخصیص هوشمند وظایف پیش‌پُرکُنی و رمزگشایی به پردازنده‌های مختلف، بهینه‌سازی عملکرد را به حداکثر می‌رساند.
فرمت NVFP4: این فرمت جدید ضمن حفظ دقت محاسباتی، عملکرد و بهره‌وری را افزایش چشمگیری می‌دهد.

ردیفی از سرورهای قدرتمند NVIDIA GB200 NVL72 با طراحی مشکی و کابل‌کشی سبز.

به نقل از Wccftech، این دستاورد نقطه عطف مهمی برای انویدیا و شرکای آن محسوب می‌شود. ازآنجاکه مدل‌های MoE به‌دلیل کارایی فراوان در‌حال گسترش در کاربردهای مختلف هستند، توانایی انویدیا در رفع موانع مقیاس‌پذیری، این شرکت را در مرکز این روند قرار می‌دهد. با ورود سرورهای GB200 NVL72 به زنجیره تأمین، انتظار می‌رود که مدل‌های هوش مصنوعی پیش‌گام بتوانند با سرعت و کارایی بیشتری توسعه یابند و قابلیت‌های خود را به سطح جدیدی برسانند.