شرکت متا در پاسخ به رونمایی “Gemini” توسط گوگل، از نسخه جدید و مستقلی از هوش مصنوعی مولد تصویر خود در وب رونمایی کرده است. این سرویس با نام “Imagine with Meta ” شناخته میشود و به کاربران امکان میدهد تا با استفاده از توصیفات زبان طبیعی، تصاویر خلاقانهای ایجاد کنند.
به گزارش تکناک و به نقل از سایت ،Techcrunch ،این سیستم، که شباهتهایی به DALL-E از OpenAI، Midjourney و Stable Diffusion دارد، توسط یک مدل تولید تصویر قدرتمند از متا به نام امو(Emu )پشتیبانی میشود. این سرویس قادر است تصاویر با وضوح بالا را از دستورات متنی تولید کند. برای کاربران در ایالات متحده، استفاده از این سرویس فعلاً رایگان بوده و به ایجاد چهار تصویر در هر دستور محدود است.
متا در یک پست وبلاگی که امروز صبح منتشر شد، اظهار داشت:
از شنیدن داستانهای کاربران درباره استفاده خلاقانه و سرگرمکننده از قابلیت تولید تصویر هوش مصنوعی تصور در چتها، بسیار خوشحال شدهایم. امروز، ما دسترسی به تصور را فراتر از چتها گسترش میدهیم. در حالی که تجربه پیامرسانی ما برای تعاملات شوخیآمیز و دوطرفه طراحی شده، اکنون کاربران میتوانند تصاویر را به صورت رایگان در وب نیز ایجاد کنند.
در گذشته ای نه چندان دور، ابزارهای تولید تصویر متا با چالشهایی روبرو شدند، مانند مسئلهی نرمافزار تولید برچسب با تعصب نژادی که شرکت را در موقعیت دشواری قرار داد. این موضوع برای نویسندگان و کاربران سوالاتی را در مورد “Imagine with Meta,” به وجود آورده است، به ویژه در خصوص اقدامات پیشگیرانهای که ممکن است برای جلوگیری از تکرار چنین مشکلاتی اتخاذ شده باشد. متاسفانه، قبل از راهاندازی این ابزار، فرصتی برای آزمایش آن در اختیار متخصصین مستقل این حوزه قرار نگرفته است
متا وعده داده است که در هفتههای آینده برای افزایش شفافیت و قابلیت ردیابی، به تصاویر تولید شده توسط “Imagine with Meta,” واترمارکهای نامرئی اضافه کند. این واترمارکها با استفاده از مدلهای هوش مصنوعی ساخته شده و قابل تشخیص با مدلهای متناظر هستند. هنوز مشخص نیست که آیا مدل تشخیص برای استفاده عموم منتشر خواهد شد یا خیر. در حال حاضر، تنها یک واترمارک قابل مشاهده وجود دارد.
متا در یک پست اعلام کرده است که واترمارکهای (نشانهای آبی) مقاومت زیادی در برابر تغییرات رایج تصویر مانند برش، تغییر اندازه، تغییر رنگ (روشنایی، کنتراست و غیره)، عکسهای صفحه، فشردهسازی تصویر، نویز، و پوششهای استیکر دارند. هدف متا این است که از این نشانگذاری نامرئی در بسیاری از محصولات خود که تصاویر تولید شده توسط هوش مصنوعی را شامل میشوند، در آینده استفاده کند.
استفاده از تکنیکهای نشانگذاری درتصاویر تولیدی توسط هوش مصنوعی چیز جدیدی نیست. استارتاپ فرانسوی Imatag یک ابزار نشانگذاری ارائه میدهد که مدعی است تحت تأثیر تغییر اندازه، برش، ویرایش، یا فشردهسازی تصاویر قرار نمیگیرد. Steg.AI ، شرکت دیگری است که از مدلهای هوش مصنوعی برای اعمال نشانهای مقاوم در برابر تغییر اندازه و ویرایشهای دیگر استفاده میکند. مایکروسافت و گوگل نیز استانداردها و فناوریهای نشانگذاری مبتنی بر هوش مصنوعی را پذیرفتهاند. در همین راستا، Shutterstock و Midjourney به توافقی برای جاسازی نشانگرهایی رسیدهاند که نشان میدهند محتوای آنها توسط ابزارهای هوش مصنوعی تولیدی ساخته شده است.
با افزایش فشار بر شرکتهای فناوری برای ایجاد شفافیت بیشتر در مورد محتوای تولید شده توسط هوش مصنوعی ، به ویژه در پرتو انتشار گسترده دیپفیکها و تصاویر سوءاستفاده از کودکان تولید شده توسط هوش مصنوعی – اداره فضای مجازی چین قوانینی وضع کرده است که نیازمند نشانگذاری محتوای تولید شده توسط تولیدکنندگان هوش مصنوعی، از جمله تولیدکنندگان متن و تصویر، بدون تأثیر بر استفاده کاربران است. همچنین در جلسات اخیر کمیته سنای آمریکا، سناتور کریستن سینما (I-AZ) بر نیاز به شفافیت در هوش مصنوعی تولیدی تأکید کرده است.