بایدو با معرفی هوش مصنوعی ERNIE 5.1 مدعی شد این مدل با بهرهوری بسیار بالاتر و هزینه آموزش ۹۴ درصد کمتر، میتواند با مدلهای پیشروی غربی و چینی رقابت کند.
به گزارش سرویس خبری هوش مصنوعی تکناک، بایدو، معادل چینی گوگل، اواخر هفته گذشته بهطور رسمی مدل ERNIE 5.1 را معرفی کرد؛ مدلی که یک عدد چشمگیر را در صدر ویژگیهای خود دارد: هزینه آموزش آن حدود ۹۴ درصد کمتر از سیستمهای هوش مصنوعی همرده در همین مقیاس بوده است.
برای درک بهتر این موضوع باید گفت آموزش یک مدل پیشرفته هوش مصنوعی معمولا چندین میلیون دلار و حتی در برخی موارد میلیاردها دلار هزینه محاسباتی دارد. بایدو که بیش از ۷۶ درصد بازار جستجوی چین را در اختیار دارد و سهام آن با نماد BIDU در نزدک معامله میشود، ادعا میکند توانسته به سطحی مشابه از عملکرد با حدود یک بیستم این هزینه دست پیدا کند.
مرتبط: هوش مصنوعی GenFlow 2.0 بایدو
ترفندی که این شرکت به کار گرفته «پیشآموزش الاستیک چندبعدی» نام دارد. بایدو به جای ساخت مدل جدید هوش مصنوعی ERNIE یعنی ERNIE 5.1 از ابتدا، یک زیرشبکه بهینهشده را از معماری ERNIE 5.0 خود استخراج کرده است؛ مدلی که در ژانویه ۲۰۲۶ معرفی شده بود. سپس این زیرشبکه فشرده شده است. در نتیجه تعداد کل پارامترها به حدود یک سوم نسخه اصلی کاهش یافته و پارامترهای فعال، یعنی آنهایی که در طول مکالمه واقعا مورد استفاده قرار میگیرند، به نصف رسیدهاند. حاصل این فرایند مدلی سبکتر است که پایگاه دانشی مدل بزرگتر والد خود را به ارث برده، بدون آنکه نیاز به تکرار هزینه کامل آموزش داشته باشد.
در LMArena Search Arena، یک جدول رتبهبندی که در آن کاربران واقعی مدلهای هوش مصنوعی را در وظایف جستجوی زنده وب با یکدیگر مقایسه میکنند و بر اساس ترجیحات انسانی امتیاز میدهند، ERNIE 5.1 امتیاز ۱۲۲۳ را به دست آورد. این امتیاز آن را در رتبه چهارم جهانی و رتبه نخست در میان تمام مدلهای چینی قرار داد. قابلیتهای عاملی این مدل، یعنی توانایی انجام وظایف چندمرحلهای مانند پر کردن صفحات گسترده یا مرور خودکار وب، از DeepSeek‑V4‑Pro که پیش از این معیار اصلی مدلهای چینی محسوب میشد نیز فراتر رفت.
نام ERNIE شاید برای ناظران غربی چندان آشنا نباشد، اما در چین یکی از مدلهای مهم به شمار میرود. بایدو در اوت ۲۰۲۳ چتبات Ernie Bot را راهاندازی کرد و این سرویس تا دسامبر همان سال در چین به ۱۰۰ میلیون کاربر رسید؛ سرعتی بیشتر از اغلب رقبا در چین، هرچند هنوز کندتر از رکورد جهانی ChatGPT بود که در مدت دو ماه به همین نقطه عطف رسید.
مرتبط: مدل هوش مصنوعی پزشکی بایدو معرفی شد

این تمرکز بر بهرهوری یادآور اتفاقی است که DeepSeek در ژانویه ۲۰۲۵ در صنعت هوش مصنوعی رقم زد. زمانی که این استارتاپ چینی مدل R1 را منتشر کرد، مدلی که با ۹۸ درصد هزینه پرسوجوی کمتر عملکردی همسطح با o1 از OpenAI داشت، ارزش بازار انویدیا حدود ۶۰۰ میلیارد دلار کاهش یافت و همین موضوع آزمایشگاههای بزرگ هوش مصنوعی را وادار کرد دوباره به این پرسش فکر کنند که آیا صرفا افزایش قدرت محاسباتی تنها راه حل ممکن است یا نه. داستان ERNIE 5.1 نیز درباره نوع دیگری از بهرهوری است؛ این بار در مرحله آموزش به جای مرحله استنتاج، اما پیام اصلی همان است: آزمایشگاههای چینی پیوسته راههایی برای انجام کارهای بیشتر با منابع کمتر پیدا میکنند.
خط لوله پس از آموزش این مدل نیز قابل توجه است. بایدو یک سیستم یادگیری تقویتی چهارمرحلهای به نام MOPD ساخته که مخفف Multi‑Teacher On‑Policy Distillation است. به جای آنکه همه مهارتها به طور همزمان آموزش داده شوند، روشی که اغلب باعث ایجاد «اثر الاکلنگی» میشود و مثلا بهبود عملکرد در ریاضی میتواند به افت توانایی در نوشتن خلاقانه منجر شود، بایدو ابتدا چند مدل متخصص را به طور موازی برای حوزههایی مانند کدنویسی، استدلال و وظایف عاملی آموزش داد. سپس همه این مدلها در قالب یک مدل واحد تقطیر شدند. در مرحله نهایی، یادگیری تقویتی آنلاین برای مدیریت مکالمات باز و تولید محتوای خلاقانه به کار گرفته شد تا مواردی که فرایند تقطیر به خوبی ثبت نکرده بود نیز حفظ شوند.
مرتبط: معرفی هوش مصنوعی Ernie 4.0 Turbo بایدو برای مشتریان سازمانی
از نظر تئوری، این رویکرد باید باعث شود سطح مهارتها در حوزههای مختلف متعادل شود، بدون آنکه یکی از آنها نسبت به بقیه اولویت پیدا کند.
در آزمون GPQA، که مخفف Graduate‑Level Google‑Proof Q&A است و معیاری برای سنجش توانایی مدل در پاسخ دادن به سوالات علمی در سطح کارشناسی ارشد و بالاتر که با جستجوی گوگل قابل پاسخ نیستند محسوب میشود، ERNIE 5.1 به عملکرد مدلهای پیشرو غربی با کد منبع بسته نزدیک شده است. در آزمون AIME26، نسخه سازگارشده با سال ۲۰۲۶ از مسابقه ریاضیات American Invitational Mathematics Examination که توانایی حل مسائل پیشرفته را در شرایط رقابتی میسنجد، این مدل هنگام استفاده از استدلال مبتنی بر ابزار امتیاز ۹۹.۶ درصد را کسب کرد و تنها از Gemini 3.1 Pro عقب ماند.
به نوشته دیکریپت، بایدو میگوید ERNIE 5.1 هماکنون در بیش از ۱۰ پلتفرم خلاقانه و عاملی در چین در حال عرضه است؛ از جمله پلتفرمهای نقشآفرینی مبتنی بر هوش مصنوعی و ابزارهای تولید درام کوتاه. این مدل از طریق ernie.baidu.com و همچنین از طریق API در پلتفرم Baidu AI Cloud در دسترس قرار دارد.
بایدو قرار است کنفرانس سالانه توسعهدهندگان خود با نام Create 2026 را در تاریخ ۱۳ تا ۱۴ مه در پکن برگزار کند؛ رویدادی که در آن برنامه دارد جدیدترین کاربردهای صنعتی ERNIE را به نمایش بگذارد. این کنفرانس میتواند نشانه مهم بعدی از میزان جدیت این شرکت برای ورود گستردهتر این مدل به بازارهای سازمانی و جهانی باشد.

















