نسل جدید مدل‌های هوش مصنوعی مایکروسافت از راه رسیدند

شرکت مایکروسافت در جریان کنفرانس Build 2026 از توسعه گسترده سبد مدل‌های هوش مصنوعی اختصاصی خود رونمایی کرد که توسط تیم Microsoft AI Superintelligence ساخته شده‌اند.

به‌ گزارش سرویس هوش مصنوعی تک‌ناک، این مجموعه تازه شامل نخستین مدل استدلالی شرکت با نام MAI-Thinking-1، مدل برنامه‌نویسی MAI-Code-1 ویژه اکوسیستم گیت‌هاب و چندین مدل جدید در حوزه تولید تصویر، تبدیل گفتار به متن و تولید صوت است. خانواده مدل‌های MAI طی یک سال گذشته به‌ سرعت گسترش یافته‌اند. مایکروسافت ابتدا MAI-Voice-1 و MAI-1-preview را معرفی کرد و پس از آن MAI-Transcribe-1 و MAI-Image-2 را به بازار آورد. این روند با عرضه MAI-Image-2.5 ادامه یافت؛ مدلی که بنا بر ادعای شرکت، در رندر متن داخل تصویر، تولید تصاویر سبک‌سازی‌شده و کیفیت خروجی‌های تجاری نسبت به نسل قبل بهبود قابل‌ توجهی داشته است.

بیشتر بخوانید: مایکروسافت از عامل‌های هوش مصنوعی جدید خود در رویداد Build رونمایی می‌ کند

برجسته‌ترین معرفی کنفرانس Build 2026 مایکروسافت، MAI-Thinking-1 بود. به گفته مایکروسافت، این مدل بدون استفاده از تکنیک تقطیر دانش و به‌ طور کامل از ابتدا آموزش داده شده است و داده‌های مورد استفاده در آن از منابع پاک، دارای مجوز تجاری و مناسب استفاده سازمانی تامین شده‌اند. MAI-Thinking-1 با ۳۵ میلیارد پارامتر فعال و پنجره متنی ۱۲۸ هزار توکنی، برای انجام استدلال‌های پیچیده، پردازش وظایف چندمرحله‌ای، تحلیل متون طولانی و تولید کد طراحی شده است. اگرچه مایکروسافت نتایج جامع بنچمارک‌ها را منتشر نکرده، اما اعلام کرده است که در ارزیابی‌های کور، داوران مستقل عملکرد MAI-Thinking-1 را نسبت به Claude Sonnet 4.6 ترجیح داده‌اند. همچنین این مدل در آزمون SWE-bench Pro به سطح عملکرد Claude Opus 4.6 در وظایف برنامه‌نویسی رسیده است. این مدل در حال حاضر در قالب پیش‌نمایش خصوصی در اختیار مشتریان منتخب قرار دارد.

مایکروسافت از نسل جدید مدل‌های هوش مصنوعی خود رونمایی کرد

برای مطالعه بیشتر: کنترل برنامه‌های ویندوز با اپلیکیشن Codex ممکن شد

همچنین مایکروسافت دسترسی برنامه‌نویسان را به مدل هوش مصنوعی MAI-Image-2.5 و نسخه کم‌تاخیر فلش آن از طریق Microsoft Foundry فراهم کرده است. بر اساس گزارش‌های پیشین، MAI-Image-2.5 در جدیدترین رتبه‌بندی Arena برای مدل‌های تبدیل متن به تصویر، عملکرد بالاتری از Nano Banana Pro گوگل ثبت کرده است. این مدل هم‌اکنون در پاورپوینت ادغام شده است و به‌ تدریج به OneDrive نیز راه پیدا می‌کند. در بخش پردازش گفتار، مایکروسافت از MAI-Transcribe-1.5 رونمایی کرد؛ نسخه ارتقایافته مدل تبدیل گفتار به متن این شرکت که اکنون از ۴۳ زبان پشتیبانی می‌کند و به گفته مایکروسافت، دقتی در سطح پیشرفته‌ترین سامانه‌های موجود ارائه می‌دهد. قابلیت پردازش جریانی نیز در آینده نزدیک به این مدل اضافه خواهد شد.

شرکت مایکروسافت پس از عرضه عمومی MAI-Voice-1 در ماه آوریل، از MAI-Voice-2 و نسخه فلش آن پرده برداشت. این نسل جدید از بیش از ۱۵ زبان اضافی پشتیبانی می‌کند و گزینه‌های صوتی متنوع‌تری را برای توسعه‌دهندگان و سازمان‌ها فراهم می‌آورد. در حوزه برنامه‌نویسی، مایکروسافت MAI-Code-1 را معرفی کرد؛ مدلی با بهره‌وری بالا در فرایند استنتاج که به‌ طور ویژه برای بارهای کاری گیت‌هاب بهینه‌سازی شده است. این مدل هم‌اکنون در GitHub Copilot و ویژوال استودیو در دسترس قرار دارد. اهمیت این معرفی از آن جهت است که مایکروسافت تاکنون از مدل‌های OpenAI و آنتروپیک برای تامین قابلیت‌های کدنویسی Copilot استفاده می‌کرد و MAI-Code-1 و MAI-Thinking-1 می‌تواند گام مهمی در مسیر استقلال بیشتر این شرکت در حوزه مدل‌های هوش مصنوعی باشد.