پلتفرم GB300 انویدیا رکورد جدیدی در عملکرد هوش مصنوعی ثبت کرد

پلتفرم Blackwell GB300 انویدیا در بنچمارک جدید AA-AgentPerf رکورد جدیدی در عملکرد هوش مصنوعی ثبت کرده است.

به گزارش سرویس سخت افزار تک‌ناک، این بنچمارک برای اندازه‌گیری عملکرد جریان‌های کاری هوش مصنوعی مبتنی بر عامل یا Agentic AI طراحی شده است.

بر اساس گزارش Artificial Analysis، بنچمارک تازه‌ای با نام AA-AgentPerf معرفی شده است که بررسی می‌کند یک استقرار استنتاجی تا چه تعداد عامل فعال را می‌تواند در شرایط کاری واقعی پشتیبانی کند. این سناریوها شامل چندین ویژگی مهم هستند.

در این آزمایش‌ها از مسیرهای واقعی عامل‌ها استفاده می‌شود؛ یعنی جلسات چندمرحله‌ای کدنویسی که در آنها فرایند استدلال، فراخوانی ابزارها و طول متغیر کانتکست به‌ صورت درهم‌تنیده انجام می‌شود و پرامپت‌های مصنوعی و یکنواخت نیستند.

همچنین بار کاری هم‌زمان و پایدار شبیه‌سازی می‌شود؛ به این معنا که عامل‌های مجازی به‌ طور مداوم درخواست‌های فعال در جریان دارند تا سازوکارهایی مانند استفاده مجدد از KV Cache، دیکودینگ پیش‌بینی‌گر و رفتار زمان‌بند سیستم تحت فشار قرار بگیرند.

سطوح عملکرد مورد انتظار یا SLO نیز بر اساس داده‌های بنچمارک API بدون سرور Artificial Analysis تعریف شده‌اند تا سطوح واقعی کیفیت سرویس که میان ارائه‌دهندگان مختلف مشاهده می‌شود منعکس شود.

نتایج این بنچمارک پلتفرم Blackwell GB300 انویدیا به‌ طور مداوم به‌روزرسانی می‌شوند تا با ورود سخت‌افزارهای جدید، پشته‌های نرم‌افزاری تازه و نسخه‌های جدید مدل‌ها همگام باقی بمانند.

در نهایت، مدل‌ها با بهینه‌سازی‌های واقعی فعال و در توپولوژی‌های استقرار در مقیاس تولید آزمایش می‌شوند تا نتایج به شرایط واقعی نزدیک باشند.

در نموداری با عنوان «AA-AgentPerf چه چیزی را اندازه می‌گیرد»، مجموعه‌ای از عامل‌ها در حال انجام یک وظیفه کدنویسی نمایش داده شده‌اند که خروجی‌هایی مانند «۱۵ تست در ۰.۴۲ ثانیه پاس شد» و «تمام تست‌ها با موفقیت انجام شد» تولید می‌کنند. در این نمودار پرسشی مطرح می‌شود: «چه تعداد از این عامل‌ها می‌توانند به طور هم‌زمان اجرا شوند؟» و معیارهایی مانند «به ازای هر میلی‌وات» و «به ازای هر شتاب‌دهنده» نمایش داده شده است.

اینفوگرافیک توضیح متدولوژی AA-AgentPerf که تعامل چندین ایجنت هوش مصنوعی با LLM و ابزارها را برای نوشتن و تست کد نشان می‌دهد و بر معیارهای کارایی بر پایه میلی‌وات (Per mW) و شتاب‌دهنده (Per Accelerator) تاکید دارد.

بنچمارک AA-AgentPerf سه شاخص کلیدی را اندازه‌گیری می‌کند که پایه بسیاری از استقرارهای مدرن هوش مصنوعی به حساب می‌آیند.

اولین شاخص Time to First Token یا TTFT است که مدت زمان بین ارسال درخواست تا دریافت اولین توکن خروجی را برای هر درخواست اندازه‌گیری می‌کند.
شاخص دوم Output Speed است که سرعت تولید توکن‌های خروجی در هر ثانیه را پس از دریافت اولین توکن محاسبه می‌کند.
شاخص سوم System Output Throughput است که مجموع توکن‌های خروجی تولیدشده در هر ثانیه توسط همه عامل‌های هم‌زمان را اندازه می‌گیرد.

شرکت انویدیا اکنون نخستین نتایج خود در بنچمارک AgentPerf را با استفاده از مدل DeepSeek V4 Pro روی پلتفرم GB300 NVL72 منتشر کرده است. این مدل نمونه‌ای از مدل‌های Frontier محسوب می‌شود که امروزه موتور اصلی بسیاری از عامل‌های هوش مصنوعی هستند و کاربرد گسترده‌ای در حوزه AI دارند.

در یک نمودار میله‌ای با عنوان «پلتفرم NVIDIA GB300 NVL72 عملکرد کدنویسی مبتنی بر عامل را ۲۰ برابر بهبود می‌دهد»، نشان داده شده است که GB300 از نظر تعداد عامل‌های هم‌زمان به ازای هر مگاوات عملکرد بسیار بهتری نسبت به H200 دارد.

در نخستین دور آزمایش‌ها، پلتفرم GB300 انویدیا سریع‌ترین عملکرد ثبت‌شده را ارائه داده و در معیار عملکرد به ازای هر مگاوات، حدود ۲۰ برابر جلوتر از پلتفرم قدیمی‌تر HGX H200 قرار گرفته است. این سیستم می‌تواند تا حدود ۶۰ هزار عامل هم‌زمان به ازای هر مگاوات انرژی را پشتیبانی کند که جهشی بسیار بزرگ نسبت به معماری Hopper محسوب می‌شود.

بر اساس داده‌های بنچمارک، شاخص Concurrent agents per MW که بهره‌وری انرژی را اندازه می‌گیرد و نشان می‌دهد یک سیستم با بودجه انرژی مشخص از چند عامل فعال پشتیبانی می‌کند، برای پلتفرم GB300 NVL72 برابر با ۶۱.۴ هزار عامل ثبت شده، در حالی که این عدد برای H200 حدود ۲.۶ هزار عامل است.

نمودار میله‌ای مقایسه عملکرد پلتفرم GB300 NVL72 انویدیا با معماری Hopper H200 که نشان‌دهنده ۲۰ برابر عملکرد بهتر در زمینه Agentic Coding بر اساس شاخص Concurrent Agents per MW است.

همچنین در شاخص Concurrent agents per GPU که میزان ظرفیت سرویس‌دهی هر GPU را نشان می‌دهد، GB300 توانسته است به عدد ۵۷.۵ عامل هم‌زمان به ازای هر GPU برسد، در حالی که این رقم برای H200 تنها حدود ۱.۴ عامل گزارش شده است.

بر اساس گزارش Wccftech، انویدیا اعلام کرده است که این نتایج نشان می‌دهد پلتفرم GB300 NVL72 و معماری Blackwell توانایی اجرای بارهای کاری بزرگ کدنویسی مبتنی بر عامل را دارند و در عین حال می‌توانند GPUها را در چندین جلسه هم‌زمان عامل‌ها به طور کامل درگیر نگه دارند.

در ادامه مسیر توسعه، معماری Rubin انویدیا نیز در افق نزدیک قرار دارد و انتظار می‌رود این برتری عملکرد را بیش از پیش افزایش دهد. این معماری جدید با یک طراحی بسیار قدرتمند برای هوش مصنوعی عرضه خواهد شد که توان محاسباتی ۵۰ پتافلاپس را از طریق NVFP4 ارائه می‌دهد. همچنین با استفاده از پردازنده Vera، فراخوانی ابزارهای LLM و عملکرد سرتاسری سیستم نیز بهبود چشمگیری در سرعت و بهره‌وری خواهند داشت.