ابزار هوش مصنوعی ویرایش تصویر اپل معرفی شد

اپل ابزاری برای ویرایش تصاویر برپایه هوش مصنوعی ساخته است. این ابزار MGIE نام دارد و به شما امکان می‌دهد تا تغییرات مدنظرتان را با شرح‌دادن آن‌ها اعمال کنید.

به‌گزارش تک‌ناک، توسعه‌دهندگان اپل هوش مصنوعی جدیدی معرفی کرده‌اند که به کاربران اجازه می‌دهد تا بدون نیاز به لمس نرم‌افزار ویرایش عکس، تغییرات مدنظرشان را به زبان ساده توصیف کنند.

ورج می‌نویسد مدل MGIE که اپل با همکاری دانشگاه کالیفرنیا، سانتا باربارا، روی آن کار کرده است، فقط با دستورهای متنی می‌تواند تصاویر را برش دهد، اندازه‌شان را تغییر دهد، آن‌ها را برگرداند و فیلترهایی به آن‌ها اضافه کند.

MGIE مخفف ویرایش تصویر هدایت‌شده با MLLM است و در طیف وسیعی از ویرایش‌های ساده و پیچیده‌تر عکس کاربردی است؛ از تغییر شکل اشیای خاص در عکس تا درخشان‌تر‌کردن آن‌ها. این مدل دو کاربرد مختلف از مدل‌های زبان چندوجهی را ترکیب می‌کند: ابتدا یاد می‌گیرد چطور دستورهای کاربر را تفسیر کند و سپس «تصویرسازی می‌کند» که ویرایش نهایی چگونه خواهد بود. برای مثال، درخواست آسمان آبی‌تر به افزایش روشنایی قسمت آسمان تصویر تبدیل می‌شود.

برای ویرایش عکس با MGIE، کافی است کاربران هرآنچه می‌خواهند در عکس تغییر دهند، فقط تایپ کنند. در مقاله، مثالی از ویرایش عکس پیتزای پپرونی آورده شده است. تایپ دستور «سالم‌ترش کن» باعث اضافه‌شدن سبزیجات به‌روی پیتزا می‌شود. تصویری تاریک از ببرهای در صحرا وجود دارد؛ اما پس از صدور دستور «برای شبیه‌سازی نور بیشتر، کنتراست بیشتری اضافه‌کن» به مدل، تصویر روشن‌تر به‌نظر می‌رسد.

پژوهشگران در مقاله خود می‌گویند:

به‌جای دستورالعمل‌های کوتاه و مبهم، MGIE هدف بصری واضحی را استخراج می‌کند و به ویرایش معقولانه تصویر منجر می‌شود. مطالعات گسترده‌ای را از جنبه‌های مختلف ویرایش انجام و نشان دادیم که MGIE عملکرد را به‌طور مؤثر بهبود می‌بخشد؛ در‌حالی‌که کارایی رقابتی را حفظ می‌کند. همچنین، معتقدیم که چهارچوب هدایت‌شده با MLLM می‌تواند به تحقیقات آینده درزمینه بینایی و زبان کمک کند.

همان‌طورکه VentureBeat گزارش می‌دهد، اپل مدل MGIE را برای دانلود از گیت‌هاب در‌دسترس قرار داده است؛ اما نسخه آزمایشی تحت‌وب آن را نیز در Hugging Face Spaces منتشر کرده است. تا‌کنون، این شرکت درباره برنامه‌های آتی خود برای این مدل فراتر از تحقیقات، اظهارنظری نکرده است.

برخی از پلتفرم‌های تولید تصویر مانند DALL-E 3 از OpenAI می‌توانند با دریافت ورودی‌های متنی، ویرایش‌های ساده‌ای روی تصاویر ساخته‌شده‌ی خود انجام دهند. ادوبی، خالق فتوشاپ، اغلب برای ویرایش عکس استفاده می‌شود. این ابزار مدل ویرایش اختصاصی AI خود را دارد. مدل Firefly AI ادوبی پس‌زمینه‌های تولید‌شده را به عکس‌ها اضافه می‌کند.

برخلاف مایکروسافت و متا یا گوگل، اپل تاکنون نقش بزرگی در دنیای هوش مصنوعی مولد ایفا نکرده؛ اما تیم کوک، مدیرعامل اپل، گفته است که امسال این شرکت می‌خواهد ویژگی‌های هوش مصنوعی بیشتری را به دستگاه‌های خود اضافه کند. در دسامبر، پژوهشگران اپل چهارچوب یادگیری ماشینی متن‌بازی به نام MLX را منتشر کردند تا آموزش مدل‌های هوش‌ مصنوعی روی تراشه‌های Apple Silicon را ساده‌تر کند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار جدید تک‌ناک را از دست ندهید.