شرکت مایکروسافت در جریان کنفرانس Build 2026 از توسعه گسترده سبد مدلهای هوش مصنوعی اختصاصی خود رونمایی کرد که توسط تیم Microsoft AI Superintelligence ساخته شدهاند.
به گزارش سرویس هوش مصنوعی تکناک، این مجموعه تازه شامل نخستین مدل استدلالی شرکت با نام MAI-Thinking-1، مدل برنامهنویسی MAI-Code-1 ویژه اکوسیستم گیتهاب و چندین مدل جدید در حوزه تولید تصویر، تبدیل گفتار به متن و تولید صوت است. خانواده مدلهای MAI طی یک سال گذشته به سرعت گسترش یافتهاند. مایکروسافت ابتدا MAI-Voice-1 و MAI-1-preview را معرفی کرد و پس از آن MAI-Transcribe-1 و MAI-Image-2 را به بازار آورد. این روند با عرضه MAI-Image-2.5 ادامه یافت؛ مدلی که بنا بر ادعای شرکت، در رندر متن داخل تصویر، تولید تصاویر سبکسازیشده و کیفیت خروجیهای تجاری نسبت به نسل قبل بهبود قابل توجهی داشته است.
بیشتر بخوانید: مایکروسافت از عاملهای هوش مصنوعی جدید خود در رویداد Build رونمایی می کند
برجستهترین معرفی کنفرانس Build 2026 مایکروسافت، MAI-Thinking-1 بود. به گفته مایکروسافت، این مدل بدون استفاده از تکنیک تقطیر دانش و به طور کامل از ابتدا آموزش داده شده است و دادههای مورد استفاده در آن از منابع پاک، دارای مجوز تجاری و مناسب استفاده سازمانی تامین شدهاند. MAI-Thinking-1 با ۳۵ میلیارد پارامتر فعال و پنجره متنی ۱۲۸ هزار توکنی، برای انجام استدلالهای پیچیده، پردازش وظایف چندمرحلهای، تحلیل متون طولانی و تولید کد طراحی شده است. اگرچه مایکروسافت نتایج جامع بنچمارکها را منتشر نکرده، اما اعلام کرده است که در ارزیابیهای کور، داوران مستقل عملکرد MAI-Thinking-1 را نسبت به Claude Sonnet 4.6 ترجیح دادهاند. همچنین این مدل در آزمون SWE-bench Pro به سطح عملکرد Claude Opus 4.6 در وظایف برنامهنویسی رسیده است. این مدل در حال حاضر در قالب پیشنمایش خصوصی در اختیار مشتریان منتخب قرار دارد.

برای مطالعه بیشتر: کنترل برنامههای ویندوز با اپلیکیشن Codex ممکن شد
همچنین مایکروسافت دسترسی برنامهنویسان را به مدل هوش مصنوعی MAI-Image-2.5 و نسخه کمتاخیر فلش آن از طریق Microsoft Foundry فراهم کرده است. بر اساس گزارشهای پیشین، MAI-Image-2.5 در جدیدترین رتبهبندی Arena برای مدلهای تبدیل متن به تصویر، عملکرد بالاتری از Nano Banana Pro گوگل ثبت کرده است. این مدل هماکنون در پاورپوینت ادغام شده است و به تدریج به OneDrive نیز راه پیدا میکند. در بخش پردازش گفتار، مایکروسافت از MAI-Transcribe-1.5 رونمایی کرد؛ نسخه ارتقایافته مدل تبدیل گفتار به متن این شرکت که اکنون از ۴۳ زبان پشتیبانی میکند و به گفته مایکروسافت، دقتی در سطح پیشرفتهترین سامانههای موجود ارائه میدهد. قابلیت پردازش جریانی نیز در آینده نزدیک به این مدل اضافه خواهد شد.
شرکت مایکروسافت پس از عرضه عمومی MAI-Voice-1 در ماه آوریل، از MAI-Voice-2 و نسخه فلش آن پرده برداشت. این نسل جدید از بیش از ۱۵ زبان اضافی پشتیبانی میکند و گزینههای صوتی متنوعتری را برای توسعهدهندگان و سازمانها فراهم میآورد. در حوزه برنامهنویسی، مایکروسافت MAI-Code-1 را معرفی کرد؛ مدلی با بهرهوری بالا در فرایند استنتاج که به طور ویژه برای بارهای کاری گیتهاب بهینهسازی شده است. این مدل هماکنون در GitHub Copilot و ویژوال استودیو در دسترس قرار دارد. اهمیت این معرفی از آن جهت است که مایکروسافت تاکنون از مدلهای OpenAI و آنتروپیک برای تامین قابلیتهای کدنویسی Copilot استفاده میکرد و MAI-Code-1 و MAI-Thinking-1 میتواند گام مهمی در مسیر استقلال بیشتر این شرکت در حوزه مدلهای هوش مصنوعی باشد.

















