شرکت مایکروسافت نخستین مولد تصویر هوش مصنوعی داخلی خود را با نام MAI-Image-1 معرفی کرد.
به گزارش تکناک، این مدل به طور کامل توسط واحد Microsoft AI طراحی و توسعه یافته است و به گفته این شرکت، نقطه عطفی در مسیر توسعه مدلهای بومی هوش مصنوعی به حساب میآید. این اقدام در ادامه برنامه مایکروسافت برای کاهش وابستگی به شرکای خارجی از جمله OepnAI و حرکت بهسوی استقلال کامل در تولید مدلهای هوش مصنوعی صورت گرفته است.
شرکت مایکروسافت اعلام کرده که برای طراحی MAI-Image-1، از بازخورد هنرمندان و متخصصان حوزه طراحی و تصویرسازی استفاده کرده است تا از تولید خروجیهای تکراری یا دارای سبکهای کلیشهای جلوگیری کند. بر اساس بیانیه رسمی شرکت، این مدل در تولید تصاویر فوتورئالیستی مانند: مناظر طبیعی، صحنههای رعد و برق و ترکیببندیهای دقیق نوری، عملکردی ممتاز دارد. از سوی دیگر، سرعت پردازش MAI-Image-1 بالاتر از مدلهای بزرگتر و پیچیدهتر توصیف شده و قادر است درخواستها را در مدتزمان کوتاهتری پردازش و تصویر نهایی را تولید کند.
نکته قابل توجه این است که نخستین مولد تصویر هوش مصنوعی مایکروسافت توانسته در ردهبندی سایت LMArena، که یکی از معتبرترین پلتفرمهای ارزیابی مدلهای مولد است، در میان ۱۰ مدل برتر قرار گیرد. در این پلتفرم، کاربران خروجیهای مختلف را مقایسه میکنند و به مدلهای برتر رأی میدهند. این موفقیت در حالی رقم خورده است که بسیاری از مدلهای پیشرو مانند DALL·E و Midjourney همچنان توسط شرکتهای ثالث توسعه مییابند و مایکروسافت تا پیش از این، از همکاری با OepnAI برای ارائه خدمات تصویری در محصولات خود استفاده میکرد.



شرکت مایکروسافت در ماههای گذشته چند مدل هوش مصنوعی جدید را معرفی کرده است، که از جمله آنها میتوان به MAI-Voice-1 AI (مولد صدا) و MAI-1-preview (چتبات اختصاصی) اشاره کرد. این شرکت با راهاندازی این پروژهها، تلاش دارد تا اکوسیستم مستقل هوش مصنوعی خود را در کنار همکاریهای خارجی توسعه دهد. در همین راستا، مایکروسافت به تازگی استفاده از مدلهای شرکت Anthropic را نیز در برخی قابلیتهای Microsoft 365 آغاز کرده و بهطور موازی، سرمایهگذاری قابل توجهی را برای آموزش مدلهای داخلی خود انجام داده است.
اگرچه هنوز امکان آزمایش عمومی نخستین مولد تصویر هوش مصنوعی مایکروسافت فراهم نشده، اما این شرکت اعلام کرده که ارزیابیهای دقیق در زمینه ایمنی و کنترل محتوا در حال انجام است. مایکروسافت تأکید کرده که هدف اصلی آن، اطمینان از نتایج «ایمنی، اخلاقی و مسئولانه» در تولید محتوای بصری است. انتظار میرود که طی ماههای آینده جزئیات بیشتری درباره عملکرد واقعی و سازوکار محافظتی این مدل منتشر شود.