انویدیا نسل سوم مدل‌های هوش مصنوعی باز Nemotron را معرفی کرد

انویدیا با معرفی خانواده Nemotron-3 در مقیاس‌های نانو، سوپر و اولترا، مبتنی بر معماری ترکیبی پنهان از متخصصان (MoE) و آموزش کم‌دقت NVFP4، جهشی چشمگیر در کارایی، مقیاس‌پذیری و کاهش هزینه استنتاج مدل‌های باز هوش مصنوعی چندعاملی ایجاد کرده است.

به گزارش سرویس هوش‌مصنوعی تکناک، شرکت انویدیا، پیشرو در فناوری‌های هوش مصنوعی، امروز از جدیدترین خانواده مدل‌های هوش مصنوعی باز خود، تحت عنوان “Nemotron-3” رونمایی کرد. این خانواده شامل سه مدل با اندازه‌های متفاوت (نانو، سوپر و اولترا) است که با هدف تسریع توسعه و استقرار هوش مصنوعی عامل شفاف، کارآمد و تخصصی در صنایع مختلف طراحی شده‌اند. مدل‌های Nemotron-3، با معرفی یک معماری پیشگامانه “ترکیبی پنهان از متخصصان (MoE)”، به توسعه‌دهندگان در ساخت سیستم‌های چندعاملی قابل اعتماد در مقیاس بزرگ کمک می‌کنند.

معرفی Nemotron-3، در راستای تلاش‌های گسترده‌تر انویدیا برای پشتیبانی از هوش مصنوعی مستقل و همکاران شفاف در سراسر جهان است. سازمان‌های متعددی از اروپا تا کره جنوبی، این مدل‌های باز، شفاف و کارآمد را برای ساخت سیستم‌های هوش مصنوعی منطبق با داده‌ها، مقررات و ارزش‌های خاص خود به کار می‌گیرند.

پذیرندگان اولیه شامل شرکت‌های بزرگی نظیر اکسنچر، کادنس، کروداسترایک، دیلویت، EY، اوراکل، پالانتیر، پرپلکسیتی، سرویس‌ناو، زیمنس و زوم هستند که مدل‌های Nemotron را برای تقویت گردش‌های کاری هوش مصنوعی در حوزه‌هایی مانند تولید، امنیت سایبری، توسعه نرم‌افزار، رسانه و ارتباطات یکپارچه می‌کنند. این مدل‌ها به استارتاپ‌ها نیز امکان می‌دهند تا عوامل هوش مصنوعی را سریع‌تر بسازند و نوآوری را از نمونه اولیه تا استقرار سازمانی تسریع بخشند.

اسلاید معرفی خانواده مدل‌های هوش مصنوعی NVIDIA Nemotron 3 شامل نسخه‌های Nano، Super و Ultra.

خانواده Nemotron-3 MoE در سه اندازه طراحی شده است:

Nemotron-3 Nano (نانو): این مدل کوچک ۳۰ میلیارد پارامتری با ۳ میلیارد فعال، برای کارهای هدفمند و بسیار کارآمد طراحی شده است.
Nemotron-3 Super (سوپر): این مدل با تقریباً ۱۰۰ میلیارد پارامتر و ۱۰ میلیارد فعال، یک مدل استدلالی با دقت بالا برای کاربردهای چندعاملی است.
Nemotron-3 Ultra (اولترا): این مدل بزرگ با حدود ۵۰۰ میلیارد پارامتر و ۵۰ میلیارد فعال، به عنوان یک موتور استدلالی قدرتمند برای کاربردهای پیچیده هوش مصنوعی عمل می‌کند.

مدل Nemotron-3 Nano که هم‌اکنون در دسترس است، مقرون‌به‌صرفه‌ترین مدل از نظر هزینه محاسباتی محسوب می‌شود. این مدل برای وظایف هدفمندی نظیر رفع اشکال نرم‌افزار، خلاصه‌سازی محتوا، دستیاران هوش مصنوعی و بازیابی اطلاعات با هزینه‌های استنتاج پایین بهینه‌سازی شده است. Nemotron-3 Nano از یک معماری MoE هیبریدی منحصربه‌فرد استفاده می‌کند که بهبودهای قابل توجهی در کارایی و مقیاس‌پذیری ارائه می‌دهد.

این طراحی، توان عملیاتی توکن را تا ۴ برابر در مقایسه با Nemotron-2 Nano افزایش داده و تولید توکن استدلالی را تا ۶۰ درصد کاهش می‌دهد که منجر به کاهش چشمگیر هزینه‌های استنتاج می‌شود. همچنین، با پنجره متنی یک میلیون توکنی، Nemotron-3 Nano قادر به حفظ اطلاعات بیشتری است که آن را در اتصال اطلاعات در طول وظایف طولانی و چند مرحله‌ای دقیق‌تر و توانمندتر می‌سازد. Artificial Analysis، یک سازمان مستقل ارزیابی هوش مصنوعی، این مدل را به عنوان بازترین و کارآمدترین مدل در میان هم‌اندازه‌های خود، با دقت پیشرو، رتبه‌بندی کرده است.

Nemotron-3 Super در کاربردهایی که به همکاری چندین عامل برای انجام وظایف پیچیده با تاخیر کم نیاز دارند، عالی عمل می‌کند. در همین حال، Nemotron-3 Ultra به عنوان یک موتور استدلالی پیشرفته برای گردش‌های کاری هوش مصنوعی که مستلزم تحقیقات عمیق و برنامه‌ریزی استراتژیک هستند، عمل خواهد کرد.

به نقل از wccftech، مدل‌های Nemotron-3 Super و Ultra از فرمت آموزشی فوق‌العاده کارآمد ۴ بیتیNVFP4 انویدیا بر روی معماری NVIDIA Blackwell استفاده می‌کنند. این فرمت، نیازهای حافظه را به طور قابل توجهی کاهش داده و فرآیند آموزش را تسریع می‌بخشد.

این کارایی، امکان آموزش مدل‌های بزرگ‌تر را بر روی زیرساخت‌های موجود بدون به خطر انداختن دقت در مقایسه با فرمت‌های با دقت بالاتر فراهم می‌کند. توسعه‌دهندگان با استفاده از خانواده Nemotron-3 می‌توانند مدل باز مناسب برای بارهای کاری خاص خود را انتخاب کرده و مقیاس‌پذیری از ده‌ها تا صدها عامل را تجربه کنند. آن‌ها همچنین از استدلال سریع‌تر و دقیق‌تر با افق دید بلند برای گردش‌های کاری پیچیده بهره‌مند خواهند شد.

نمودار مقایسه «هوش» در برابر «سرعت خروجی» مدل‌های مختلف زبانی با برجسته بودن مدل NVIDIA Nemotron 3 Nano.

Nemotron-3 Nano هم‌اکنون در Hugging Face و از طریق ارائه‌دهندگان خدمات استنتاجی مانند Baseten، Deepinfra، Fireworks، FriendliAI، OpenRouter و Together AI در دسترس است. این مدل همچنین در پلتفرم‌های زیرساخت داده و هوش مصنوعی سازمانی از جمله Couchbase، DataRobot، H2O.ai، JFrog، Lambda و UiPath ارائه می‌شود.

به زودی، Nemotron-3 Nano برای مشتریان در ابرهای عمومی از طریق Amazon Bedrock (بدون سرور)، گوگل کلود، کورویو، نبیوس، ان‌اسکیل و یوتا نیز پشتیبانی خواهد شد. این مدل به عنوان یک میکروسرویس NVIDIA NIM™ نیز برای استقرار امن و مقیاس‌پذیر در هر نقطه از زیرساخت‌های شتاب‌دهنده انویدیا برای حداکثر حریم خصوصی و کنترل در دسترس است. انتظار می‌رود مدل‌های Nemotron-3 Super و Ultra انویدیا در نیمه اول سال ۲۰۲۶ در دسترس قرار گیرند.