شرکت شیائومی که تا پیش از این با نوآوری در زمینه سختافزار شناخته میشد، اکنون با تمرکز بر توسعه نرمافزارهای پیشرفته و رونمایی از نخستین مدل استدلالی تخصصی خود به نام MiMo 7B، وارد میدان رقابت هوش مصنوعی شده است.
به گزارش تکناک، این مدل که به صورت متنباز توسط تیم جدید «هسته مدل بزرگ» شیائومی توسعه یافته، تنها با ۷ میلیارد پارامتر موفق شده است که در تستهای عملکردی، رقبای پرقدرتی مانند: مدل o1-mini از OpenAI و مدل 32 میلیارد پارامتری QwQ-Preview علیبابا را شکست دهد.
مدل MiMo 7B در آزمونهای عمومی از جمله مجموعه ریاضی AIME (سالهای ۲۰۲۴-۲۰۲۵) و رقابتهای کدنویسی LiveCodeBench v5، توانسته است مدلهایی با چندین برابر پارامتر بیشتر را پشت سر بگذارد. به گفته تیم توسعه، این موفقیت حاصل یک استراتژی نوآورانه دو مرحلهای شامل پیشآموزش و پسآموزش بوده است.
شرکت شیائومی در مرحله پیشآموزش، از چندین تکنیک کلیدی بهره برده است، که عبارتانداز:
- استفاده از مجموعه دادههای غنی در حوزه استدلال
- تولید حدود ۲۰۰ میلیارد توکن داده استدلالی در سطح کارشناسی
- طراحی فازهای آموزشی با سختی تدریجی در سه مرحله
- آموزش گسترده روی بیش از ۲۵ تریلیون توکن

در مرحله پسآموزش نیز نوآوریهای قابل توجهی انجام شده است، که شامل موارد زیر میشود:
- بهکارگیری سیستم پاداشدهی مبتنی بر دشواری تست برای مقابله با پراکندگی پاداشها،
- استفاده از روشهای ساده بازنمونهگیری داده برای پایداری یادگیری تقویتی،
- پیادهسازی سیستم یکپارچه انتشار که سرعت آموزش را ۲.۲۹ برابر و فرایند تأیید را ۱.۹۶ برابر افزایش داده است.


ورود MiMo به بازار هوش مصنوعی، نشاندهنده رویکرد جدید و بلندپروازانه شیائومی در این حوزه است. این شرکت با ارائه مدل به صورت متنباز از طریق مخزن Hugging Face و همراه با مستندات فنی کامل، جامعه توسعهدهندگان را به تعامل و نوآوری بیشتر فرا میخواند. به نظر میرسد که شیائومی نهتنها در حوزه سختافزار، بلکه در آینده نرمافزاری هوش مصنوعی نیز حرفهای زیادی برای گفتن خواهد داشت.