مایکروسافت مدل زبانی Mu را معرفی کرد

مایکروسافت مدل زبانی جدیدی به نام Mu معرفی کرده است؛ یک LLM کوچک‌مقیاس با معماری encoder–decoder و حجم حدود ۳۳۰ میلیون پارامتر که به‌صورت کاملاً محلی و روی NPU با سرعت بیش از ۱۰۰ توکن بر ثانیه اجرا می شود.

به گزارش تکناک، این مدل با بهینه‌سازی سخت‌افزاری (استفاده از weight‑sharing، Grouped‑Query Attention، RoPE)، تأخیر پردازش را تا ۴۷٪ کاهش و سرعت رمزگشایی را تا ۴.۷ برابر افزایش داده است.

مایکروسافت اخیراً مدل زبانی جدید خود به نام Mu را معرفی کرده است که به طور خاص برای اجرای محلی و بهبود کارایی پردازش زبان طبیعی در دستگاه‌های کم‌منابع طراحی شده است. این مدل با هدف بهبود تجربه کاربری در ویندوز، به ویژه در بخش تنظیمات، ساخته شده و توانسته است عملکرد چشمگیری را در پردازش درخواست‌های ورودی از کاربران ارائه دهد.

01
از 05
معرفی مدل Mu

ویندوزبلاگ می‌نویسد که مدل Mu از معماری encoder-decoder بهره می‌برد که به آن این امکان را می‌دهد تا ورودی‌ها را به نمایشی ثابت تبدیل کرده و سپس خروجی‌ها را بر اساس آن تولید کند. این طراحی باعث کاهش بار پردازشی و مصرف حافظه می‌شود و در نتیجه عملکرد سریع‌تری را بر روی سخت‌افزارهای کم‌منابع ارائه می‌دهد. استفاده از واحد پردازش عصبی (NPU) در دستگاه‌های Copilot+ ویندوز موجب شده است تا این مدل بتواند بیش از 100 توکن در ثانیه پردازش کند و به نیازهای کاربر برای تجربه‌ای روان و سریع پاسخ دهد.

02
از 05
آموزش و بهینه‌سازی مدل Mu

برای ساخت مدل Mu، مایکروسافت از GPUهای A100 در پلتفرم Azure Machine Learning استفاده کرد. این مدل با استفاده از داده‌های آموزشی با کیفیت بالا و تکنیک‌های پیشرفته‌ای مانند distillation از مدل‌های پیشین Phi توسعه یافت. این فرآیند به Mu این امکان را داد که با حجم کمتری از پارامترها به عملکردی مشابه مدل‌های بزرگ‌تر دست یابد.

مدل Mu با 330 میلیون پارامتر بهینه‌سازی شده است تا بتواند به سرعت بالا و دقت بالا در پردازش درخواست‌ها دست یابد. علاوه بر این، از تکنیک‌هایی مانند اشتراک‌گذاری وزن‌ها برای کاهش تعداد پارامترها و بهینه‌سازی استفاده از حافظه بهره برده است. این ویژگی‌ها موجب بهبود عملکرد و کاهش زمان تاخیر مدل در دستگاه‌های مجهز به NPU، به ویژه دستگاه‌های Copilot+ ویندوز، شده است.

03
از 05
کمی‌سازی و بهینه‌سازی برای دستگاه‌های کم‌منابع

مدل Mu به طور ویژه برای اجرا بر روی دستگاه‌هایی با منابع محدود مانند Copilot+ PCs بهینه‌سازی شده است. برای این کار، مایکروسافت از تکنیک‌های پیشرفته کمی‌سازی مدل برای کاهش نیاز به حافظه و محاسبات استفاده کرد. این فرآیند موجب حفظ دقت مدل در عین کاهش مصرف منابع و تسریع در روند اجرا شده است. همچنین همکاری با شرکای سخت‌افزاری مانند AMD، Intel و Qualcomm برای بهینه‌سازی عملیات مدل در سطح سخت‌افزاری صورت گرفت.

04
از 05
آینده مدل Mu و کاربرد آن در ویندوز

مدل Mu به طور ویژه برای بهبود تجربه کاربری در تنظیمات ویندوز طراحی شده است. هدف اصلی این است که کاربران بتوانند از ورودی‌های زبان طبیعی برای تغییر تنظیمات سیستم خود استفاده کنند. به عنوان بخشی از ویندوز Copilot+، این مدل قادر است تنظیمات مختلف سیستم را به طور خودکار تغییر دهد و از طریق جعبه جستجوی تنظیمات، دسترسی سریع به تنظیمات مختلف را فراهم کند.

در حال حاضر، این ویژگی در نسخه آزمایشی ویندوز برای کاربران Windows Insiders در دسترس است و مایکروسافت قصد دارد بازخوردهای کاربران را دریافت کرده و قابلیت‌های مدل Mu را بهبود بخشد. این مدل توانسته است تا با بهبود سرعت و دقت، تجربه کاربری را به سطح جدیدی ارتقاء دهد و در آینده نزدیک شاهد گسترش استفاده از آن در دیگر بخش‌های ویندوز خواهیم بود.

05
از 05
نتیجه‌گیری

مدل زبانی Mu مایکروسافت به عنوان یک مدل کوچک و کارآمد برای پردازش زبان طبیعی در دستگاه‌های کم‌منابع طراحی شده است. با استفاده از تکنیک‌های پیشرفته مانند encoder-decoder architecture و کمی‌سازی، این مدل قادر است به سرعت بالاتر و دقت بیشتر در دستگاه‌های ویندوز پاسخ دهد. این فناوری نوآورانه به کاربران این امکان را می‌دهد که از طریق زبان طبیعی به تغییر تنظیمات ویندوز پرداخته و تجربه‌ای ساده‌تر و سریع‌تر داشته باشند.