سرورهای GB200 بلکول انویدیا با طراحی مشترک سختافزار و نرمافزار، مدلهای MoE را تا ۱۰ برابر سریعتر اجرا میکنند.
به گزارش سرویس سختافزار تکناک، انویدیا امروز از دستاوردی بزرگ درزمینه پردازش هوش مصنوعی پردهبرداری کرد. این شرکت اعلام کرد که با استفاده از سرورهای جدید GB200 بلکول NVL72 خود، توانسته است عملکرد مدلهای هوش مصنوعی MoE را تا ۱۰ برابر افزایش دهد. این پیشرفت که حاصل رویکرد نوآورانه «طراحی مشترک» است، یکی از موانع محاسباتی بزرگ در مسیر مقیاسپذیری این مدلهای پیشرفته را از میان برمیدارد.
مدلهای هوش مصنوعی MoE بهدلیل بهینگی محاسباتی، بهسرعت درحال تبدیلشدن به استانداردی مهم در دنیای هوش مصنوعی هستند. این مدلها برخلاف مدلهای زبان بزرگ سنتی که برای هر پرسوجو تمام پارامترهای خود را فعال میکنند، تنها بخش کوچکی از «متخصصان» خود را متناسب با نوع درخواست به کار میگیرند. بااینحال، افزایش مقیاس و بزرگترکردن این مدلها همواره با گلوگاه محاسباتی بزرگی همراه بوده است که از بهرهبرداری کامل از پتانسیل آنها مانع میشد.
انویدیا در بیانیه مطبوعاتی خود فاش کرد که برای نمایش این قابلیت، عملکرد خوشه هوش مصنوعی GB200 NVL72 را روی مدل زبان بزرگ منبعباز Kimi K2 Thinking آزموده است. این مدل که ۳۲ میلیارد پارامتر فعال دارد، گزینهای برجسته در حوزه MoE محسوب میشود. نتایج نشان داد که معماری جدید بلکول در مقایسه با نسل قبلی، یعنی سرورهای Hopper HGX 200، عملکردی ۱۰ برابر سریعتر ارائه میدهد. به گفته تیم سبز، معماری بلکول کاملاً برای بهرهبرداری از ظهور مدلهای پیشگام MoE آماده شده است.

راز این موفقیت در رویکرد «طراحی مشترک» انویدیا نهفته است. این شرکت با بهینهسازی همزمان سختافزار و نرمافزار، توانسته است بر محدودیتهای ارتباطی غلبه کند. پیکربندی GB200 با ۷۲ تراشه و ۳۰ ترابایت حافظه سریع مشترک، امکان موازیسازی تخصصی را در سطحی بیسابقه فراهم میکند. این ساختار تضمین میکند که دستههای توکن بهطور مداوم و بهینه میان پردازندههای گرافیکی تقسیم شوند و حجم ارتباطات غیرضروری کاهش یابد.
علاوهبر این، بهینهسازیهای نرمافزاری نیز نقشی مهمی در این دستاورد ایفا کردهاند:
- چهارچوب Dynamo انویدیا: با تخصیص هوشمند وظایف پیشپُرکُنی و رمزگشایی به پردازندههای مختلف، بهینهسازی عملکرد را به حداکثر میرساند.
- فرمت NVFP4: این فرمت جدید ضمن حفظ دقت محاسباتی، عملکرد و بهرهوری را افزایش چشمگیری میدهد.

به نقل از Wccftech، این دستاورد نقطه عطف مهمی برای انویدیا و شرکای آن محسوب میشود. ازآنجاکه مدلهای MoE بهدلیل کارایی فراوان درحال گسترش در کاربردهای مختلف هستند، توانایی انویدیا در رفع موانع مقیاسپذیری، این شرکت را در مرکز این روند قرار میدهد. با ورود سرورهای GB200 NVL72 به زنجیره تأمین، انتظار میرود که مدلهای هوش مصنوعی پیشگام بتوانند با سرعت و کارایی بیشتری توسعه یابند و قابلیتهای خود را به سطح جدیدی برسانند.

















