شرکت انویدیا در گزارشی فنی، جزئیات کلیدی نسل جدید شتابدهندههای هوش مصنوعی خود موسوم به Blackwell Ultra را تشریح کرد که مهمترین ویژگیهای آن شامل تأیید رسمی پشتیبانی از رابط پرسرعت PCIe 6.0 و معرفی فرمت دادهی جدید NV-FP4 است.
به گزارش تکناک، این شرکت اعلام کرد که پردازندههای سری B300 بهعنوان پرچمداران جدید مراکز داده، بهبودهایی اساسی در زمینه توان پردازشی، حافظه و ارتباطات ارائه میدهند.
فهرست مطالب
ارتقاهای کلیدی در Blackwell Ultra
تامزهاردور مینویسد که طبق اعلام انویدیا، سری B300 Ultra نسبت به نسل پیشین B200 تغییرات مهمی را تجربه کرده است:
- استفاده از هستههای Tensor بهینهسازیشده برای فرمت داده NVFP4 که تا ۵۰ درصد توان پردازشی بالاتر ارائه میدهد.
- افزایش حافظه HBM3E از ۱۹۲ گیگابایت به ۲۸۸ گیگابایت.
- پشتیبانی رسمی از PCIe 6.x که پهنای باند دوطرفه را به ۱۲۸ گیگابایت بر ثانیه افزایش میدهد.
- افزایش توان حرارتی طراحی (TDP) از ۱۲۰۰ وات به ۱۴۰۰ وات.

NVFP4؛ فرمت اختصاصی برای افزایش بهرهوری
انویدیا با معرفی NVFP4 بهعنوان فرمت ممیز شناور ۴ بیتی اختصاصی، مدعی است که این نوآوری میتواند هم در آموزش و هم در استنتاج مدلهای هوش مصنوعی عملکرد چشمگیری داشته باشد.
این فرمت با ترکیب کدگذاری فشرده و مقیاسدهی چندسطحی، نتایجی نزدیک به دقت BF16 ارائه میدهد، در حالی که مصرف حافظه را تا ۳.۵ برابر نسبت به FP16 کاهش میدهد. انویدیا همچنین اعلام کرده است که انحراف NVFP4 نسبت به FP8 معمولاً کمتر از یک درصد است.
کارایی در بارهای کاری هوش مصنوعی
نتایج آزمایشهای داخلی انویدیا نشان میدهد که GPUهای Blackwell Ultra در اجرای مدلهای پیشرفته عملکرد قابل توجهی دارند. برای نمونه:
- در مدل GPT-OSS 120B، GPUهای B200 تا چهار برابر تعامل سریعتر بدون افت توان عملیاتی را نشان دادهاند.
- در مدل DeepSeek-R1 671B، بهرهوری تا ۲.۵ برابر افزایش یافته است.
به گفته انویدیا، NVFP4 نخستین فرمت ۴ بیتی ممیز شناور است که امکان آموزش در مقیاس تریلیون توکن را فراهم میسازد.

پشتیبانی در چارچوبهای متنباز
گرچه NVFP4 فرمت اختصاصی انویدیا است، این شرکت آن را در کتابخانههای متنباز نیز عرضه کرده است. چارچوبهایی نظیر Cutclass، NCCL و TensorRT Model Optimizer اکنون از NVFP4 پشتیبانی میکنند. همچنین در سطوح بالاتر، NeMo، PhysicsNeMo و BioNeMo قابلیت استفاده از این فرمت را برای مدلهای زبانی، علمی و زیستی فراهم کردهاند.
محدودیتها و رقابتپذیری
NVFP4 تنها در سختافزار انویدیا قابل استفاده است و بعید است توسط سازندگان مستقل سختافزار پشتیبانی شود. این موضوع میتواند برای برخی توسعهدهندگان محدودکننده باشد. با این حال، انویدیا در تلاش است پشتیبانی از این فرمت را به طیف وسیعی از محصولات خود، از جمله GeForce RTX 5090 و راهکارهای DGX Spark گسترش دهد.
نخستین GPU با PCIe Gen6
Blackwell Ultra اولین پردازنده گرافیکی مرکز داده است که به طور رسمی از PCIe Gen6 پشتیبانی میکند. این فناوری با دو برابر کردن سرعت انتقال داده میان GPU، CPU و سایر اجزای سختافزاری، توان خوشههای هوش مصنوعی را به شکل چشمگیری افزایش میدهد.
معماری Blackwell Ultra نشاندهنده گام بزرگی برای انویدیا در رقابت بر سر پردازشهای هوش مصنوعی و مراکز داده است. ترکیب فرمت اختصاصی NVFP4 با حافظه بیشتر و پشتیبانی از PCIe 6.0، این پردازندهها را به گزینهای قدرتمند برای ارائهدهندگان خدمات ابری و شرکتهای فعال در حوزه هوش مصنوعی تبدیل میکند.