مدل جدید هوش مصنوعی بایدو ارزان‌تر و قوی‌تر از رقبا ظاهر شد

بایدو با معرفی هوش مصنوعی ERNIE 5.1 مدعی شد این مدل با بهره‌وری بسیار بالاتر و هزینه آموزش ۹۴ درصد کمتر، می‌تواند با مدل‌های پیشروی غربی و چینی رقابت کند.

به گزارش سرویس خبری هوش مصنوعی تکناک، بایدو، معادل چینی گوگل، اواخر هفته گذشته به‌طور رسمی مدل ERNIE 5.1 را معرفی کرد؛ مدلی که یک عدد چشمگیر را در صدر ویژگی‌های خود دارد: هزینه آموزش آن حدود ۹۴ درصد کمتر از سیستم‌های هوش مصنوعی هم‌رده در همین مقیاس بوده است.

برای درک بهتر این موضوع باید گفت آموزش یک مدل پیشرفته هوش مصنوعی معمولا چندین میلیون دلار و حتی در برخی موارد میلیاردها دلار هزینه محاسباتی دارد. بایدو که بیش از ۷۶ درصد بازار جستجوی چین را در اختیار دارد و سهام آن با نماد BIDU در نزدک معامله می‌شود، ادعا می‌کند توانسته به سطحی مشابه از عملکرد با حدود یک بیستم این هزینه دست پیدا کند.

مرتبط: هوش مصنوعی GenFlow 2.0 بایدو

ترفندی که این شرکت به کار گرفته «پیش‌آموزش الاستیک چندبعدی» نام دارد. بایدو به جای ساخت مدل جدید هوش مصنوعی ERNIE یعنی ERNIE 5.1 از ابتدا، یک زیرشبکه بهینه‌شده را از معماری ERNIE 5.0 خود استخراج کرده است؛ مدلی که در ژانویه ۲۰۲۶ معرفی شده بود. سپس این زیرشبکه فشرده شده است. در نتیجه تعداد کل پارامترها به حدود یک سوم نسخه اصلی کاهش یافته و پارامترهای فعال، یعنی آن‌هایی که در طول مکالمه واقعا مورد استفاده قرار می‌گیرند، به نصف رسیده‌اند. حاصل این فرایند مدلی سبک‌تر است که پایگاه دانشی مدل بزرگ‌تر والد خود را به ارث برده، بدون آنکه نیاز به تکرار هزینه کامل آموزش داشته باشد.

در LMArena Search Arena، یک جدول رتبه‌بندی‌ که در آن کاربران واقعی مدل‌های هوش مصنوعی را در وظایف جستجوی زنده وب با یکدیگر مقایسه می‌کنند و بر اساس ترجیحات انسانی امتیاز می‌دهند، ERNIE 5.1 امتیاز ۱۲۲۳ را به دست آورد. این امتیاز آن را در رتبه چهارم جهانی و رتبه نخست در میان تمام مدل‌های چینی قرار داد. قابلیت‌های عاملی این مدل، یعنی توانایی انجام وظایف چندمرحله‌ای مانند پر کردن صفحات گسترده یا مرور خودکار وب، از DeepSeek‑V4‑Pro که پیش از این معیار اصلی مدل‌های چینی محسوب می‌شد نیز فراتر رفت.

نام ERNIE شاید برای ناظران غربی چندان آشنا نباشد، اما در چین یکی از مدل‌های مهم به شمار می‌رود. بایدو در اوت ۲۰۲۳ چت‌بات Ernie Bot را راه‌اندازی کرد و این سرویس تا دسامبر همان سال در چین به ۱۰۰ میلیون کاربر رسید؛ سرعتی بیشتر از اغلب رقبا در چین، هرچند هنوز کندتر از رکورد جهانی ChatGPT بود که در مدت دو ماه به همین نقطه عطف رسید.

مرتبط: مدل هوش مصنوعی پزشکی بایدو معرفی شد

دیاگرام معماری مدل هوش مصنوعی با نمایش Elastic Depth، Elastic Width و Elastic Sparsity در لایه‌های ترنسفورمر و Mixture of Experts.

این تمرکز بر بهره‌وری یادآور اتفاقی است که DeepSeek در ژانویه ۲۰۲۵ در صنعت هوش مصنوعی رقم زد. زمانی که این استارتاپ چینی مدل R1 را منتشر کرد، مدلی که با ۹۸ درصد هزینه پرس‌وجوی کمتر عملکردی هم‌سطح با o1 از OpenAI داشت، ارزش بازار انویدیا حدود ۶۰۰ میلیارد دلار کاهش یافت و همین موضوع آزمایشگاه‌های بزرگ هوش مصنوعی را وادار کرد دوباره به این پرسش فکر کنند که آیا صرفا افزایش قدرت محاسباتی تنها راه حل ممکن است یا نه. داستان ERNIE 5.1 نیز درباره نوع دیگری از بهره‌وری است؛ این بار در مرحله آموزش به جای مرحله استنتاج، اما پیام اصلی همان است: آزمایشگاه‌های چینی پیوسته راه‌هایی برای انجام کارهای بیشتر با منابع کمتر پیدا می‌کنند.

خط لوله پس از آموزش این مدل نیز قابل توجه است. بایدو یک سیستم یادگیری تقویتی چهارمرحله‌ای به نام MOPD ساخته که مخفف Multi‑Teacher On‑Policy Distillation است. به جای آنکه همه مهارت‌ها به طور همزمان آموزش داده شوند، روشی که اغلب باعث ایجاد «اثر الاکلنگی» می‌شود و مثلا بهبود عملکرد در ریاضی می‌تواند به افت توانایی در نوشتن خلاقانه منجر شود، بایدو ابتدا چند مدل متخصص را به طور موازی برای حوزه‌هایی مانند کدنویسی، استدلال و وظایف عاملی آموزش داد. سپس همه این مدل‌ها در قالب یک مدل واحد تقطیر شدند. در مرحله نهایی، یادگیری تقویتی آنلاین برای مدیریت مکالمات باز و تولید محتوای خلاقانه به کار گرفته شد تا مواردی که فرایند تقطیر به خوبی ثبت نکرده بود نیز حفظ شوند.

مرتبط: معرفی هوش مصنوعی Ernie 4.0 Turbo بایدو برای مشتریان سازمانی

از نظر تئوری، این رویکرد باید باعث شود سطح مهارت‌ها در حوزه‌های مختلف متعادل شود، بدون آنکه یکی از آن‌ها نسبت به بقیه اولویت پیدا کند.

در آزمون GPQA، که مخفف Graduate‑Level Google‑Proof Q&A است و معیاری برای سنجش توانایی مدل در پاسخ دادن به سوالات علمی در سطح کارشناسی ارشد و بالاتر که با جستجوی گوگل قابل پاسخ نیستند محسوب می‌شود، ERNIE 5.1 به عملکرد مدل‌های پیشرو غربی با کد منبع بسته نزدیک شده است. در آزمون AIME26، نسخه سازگارشده با سال ۲۰۲۶ از مسابقه ریاضیات American Invitational Mathematics Examination که توانایی حل مسائل پیشرفته را در شرایط رقابتی می‌سنجد، این مدل هنگام استفاده از استدلال مبتنی بر ابزار امتیاز ۹۹.۶ درصد را کسب کرد و تنها از Gemini 3.1 Pro عقب ماند.

به نوشته دیکریپت، بایدو می‌گوید ERNIE 5.1 هم‌اکنون در بیش از ۱۰ پلتفرم خلاقانه و عاملی در چین در حال عرضه است؛ از جمله پلتفرم‌های نقش‌آفرینی مبتنی بر هوش مصنوعی و ابزارهای تولید درام کوتاه. این مدل از طریق ernie.baidu.com و همچنین از طریق API در پلتفرم Baidu AI Cloud در دسترس قرار دارد.

بایدو قرار است کنفرانس سالانه توسعه‌دهندگان خود با نام Create 2026 را در تاریخ ۱۳ تا ۱۴ مه در پکن برگزار کند؛ رویدادی که در آن برنامه دارد جدیدترین کاربردهای صنعتی ERNIE را به نمایش بگذارد. این کنفرانس می‌تواند نشانه مهم بعدی از میزان جدیت این شرکت برای ورود گسترده‌تر این مدل به بازارهای سازمانی و جهانی باشد.

مرتبط: یک مدیر بایدو به سرقت تکنولوژی اپل متهم شد