اپل ابزاری برای ویرایش تصاویر برپایه هوش مصنوعی ساخته است. این ابزار MGIE نام دارد و به شما امکان میدهد تا تغییرات مدنظرتان را با شرحدادن آنها اعمال کنید.
بهگزارش تکناک، توسعهدهندگان اپل هوش مصنوعی جدیدی معرفی کردهاند که به کاربران اجازه میدهد تا بدون نیاز به لمس نرمافزار ویرایش عکس، تغییرات مدنظرشان را به زبان ساده توصیف کنند.
ورج مینویسد مدل MGIE که اپل با همکاری دانشگاه کالیفرنیا، سانتا باربارا، روی آن کار کرده است، فقط با دستورهای متنی میتواند تصاویر را برش دهد، اندازهشان را تغییر دهد، آنها را برگرداند و فیلترهایی به آنها اضافه کند.
MGIE مخفف ویرایش تصویر هدایتشده با MLLM است و در طیف وسیعی از ویرایشهای ساده و پیچیدهتر عکس کاربردی است؛ از تغییر شکل اشیای خاص در عکس تا درخشانترکردن آنها. این مدل دو کاربرد مختلف از مدلهای زبان چندوجهی را ترکیب میکند: ابتدا یاد میگیرد چطور دستورهای کاربر را تفسیر کند و سپس «تصویرسازی میکند» که ویرایش نهایی چگونه خواهد بود. برای مثال، درخواست آسمان آبیتر به افزایش روشنایی قسمت آسمان تصویر تبدیل میشود.
برای ویرایش عکس با MGIE، کافی است کاربران هرآنچه میخواهند در عکس تغییر دهند، فقط تایپ کنند. در مقاله، مثالی از ویرایش عکس پیتزای پپرونی آورده شده است. تایپ دستور «سالمترش کن» باعث اضافهشدن سبزیجات بهروی پیتزا میشود. تصویری تاریک از ببرهای در صحرا وجود دارد؛ اما پس از صدور دستور «برای شبیهسازی نور بیشتر، کنتراست بیشتری اضافهکن» به مدل، تصویر روشنتر بهنظر میرسد.
پژوهشگران در مقاله خود میگویند:
بهجای دستورالعملهای کوتاه و مبهم، MGIE هدف بصری واضحی را استخراج میکند و به ویرایش معقولانه تصویر منجر میشود. مطالعات گستردهای را از جنبههای مختلف ویرایش انجام و نشان دادیم که MGIE عملکرد را بهطور مؤثر بهبود میبخشد؛ درحالیکه کارایی رقابتی را حفظ میکند. همچنین، معتقدیم که چهارچوب هدایتشده با MLLM میتواند به تحقیقات آینده درزمینه بینایی و زبان کمک کند.
همانطورکه VentureBeat گزارش میدهد، اپل مدل MGIE را برای دانلود از گیتهاب دردسترس قرار داده است؛ اما نسخه آزمایشی تحتوب آن را نیز در Hugging Face Spaces منتشر کرده است. تاکنون، این شرکت درباره برنامههای آتی خود برای این مدل فراتر از تحقیقات، اظهارنظری نکرده است.
برخی از پلتفرمهای تولید تصویر مانند DALL-E 3 از OpenAI میتوانند با دریافت ورودیهای متنی، ویرایشهای سادهای روی تصاویر ساختهشدهی خود انجام دهند. ادوبی، خالق فتوشاپ، اغلب برای ویرایش عکس استفاده میشود. این ابزار مدل ویرایش اختصاصی AI خود را دارد. مدل Firefly AI ادوبی پسزمینههای تولیدشده را به عکسها اضافه میکند.
برخلاف مایکروسافت و متا یا گوگل، اپل تاکنون نقش بزرگی در دنیای هوش مصنوعی مولد ایفا نکرده؛ اما تیم کوک، مدیرعامل اپل، گفته است که امسال این شرکت میخواهد ویژگیهای هوش مصنوعی بیشتری را به دستگاههای خود اضافه کند. در دسامبر، پژوهشگران اپل چهارچوب یادگیری ماشینی متنبازی به نام MLX را منتشر کردند تا آموزش مدلهای هوش مصنوعی روی تراشههای Apple Silicon را سادهتر کند.