ورود طوفانی شیائومی به دنیای هوش مصنوعی با مدل MiMo 7B

شرکت شیائومی که تا پیش از این با نوآوری در زمینه سخت‌افزار شناخته می‌شد، اکنون با تمرکز بر توسعه نرم‌افزارهای پیشرفته و رونمایی از نخستین مدل استدلالی تخصصی خود به نام MiMo 7B، وارد میدان رقابت هوش مصنوعی شده است.

به گزارش تک‌ناک، این مدل که به‌ صورت متن‌باز توسط تیم جدید «هسته مدل بزرگ» شیائومی توسعه یافته، تنها با ۷ میلیارد پارامتر موفق شده است که در تست‌های عملکردی، رقبای پرقدرتی مانند: مدل o1-mini از OpenAI و مدل 32 میلیارد پارامتری QwQ-Preview علی‌بابا را شکست دهد.

مدل MiMo 7B در آزمون‌های عمومی از جمله مجموعه ریاضی AIME (سال‌های ۲۰۲۴-۲۰۲۵) و رقابت‌های کدنویسی LiveCodeBench v5، توانسته است مدل‌هایی با چندین برابر پارامتر بیشتر را پشت سر بگذارد. به گفته تیم توسعه، این موفقیت حاصل یک استراتژی نوآورانه دو مرحله‌ای شامل پیش‌آموزش و پس‌آموزش بوده است.

شرکت شیائومی در مرحله پیش‌آموزش، از چندین تکنیک کلیدی بهره برده است، که عبارت‌انداز:

استفاده از مجموعه‌ داده‌های غنی در حوزه استدلال
تولید حدود ۲۰۰ میلیارد توکن داده استدلالی در سطح کارشناسی
طراحی فازهای آموزشی با سختی تدریجی در سه مرحله
آموزش گسترده روی بیش از ۲۵ تریلیون توکن

ورود شیائومی به دنیای هوش مصنوعی با مدل MiMo 7B

در مرحله پس‌آموزش نیز نوآوری‌های قابل‌ توجهی انجام شده است، که شامل موارد زیر می‌شود:

به‌کارگیری سیستم پاداش‌دهی مبتنی بر دشواری تست برای مقابله با پراکندگی پاداش‌ها،
استفاده از روش‌های ساده بازنمونه‌گیری داده برای پایداری یادگیری تقویتی،
پیاده‌سازی سیستم یکپارچه انتشار که سرعت آموزش را ۲.۲۹ برابر و فرایند تأیید را ۱.۹۶ برابر افزایش داده است.

شیائومی به دنیای هوش مصنوعی با مدل MiMo 7B وارد شد

ورود MiMo به بازار هوش مصنوعی، نشان‌دهنده رویکرد جدید و بلندپروازانه شیائومی در این حوزه است. این شرکت با ارائه مدل به‌ صورت متن‌باز از طریق مخزن Hugging Face و همراه با مستندات فنی کامل، جامعه توسعه‌دهندگان را به تعامل و نوآوری بیشتر فرا می‌خواند. به نظر می‌رسد که شیائومی نه‌تنها در حوزه سخت‌افزار، بلکه در آینده‌ نرم‌افزاری هوش مصنوعی نیز حرف‌های زیادی برای گفتن خواهد داشت.