متا از ابزار هوش مصنوعی مولد تصویر Imagine with Meta رونمایی کرد

شرکت متا در پاسخ به رونمایی “Gemini” توسط گوگل، از نسخه جدید و مستقلی از هوش مصنوعی مولد تصویر خود در وب رونمایی کرده است. این سرویس با نام “Imagine with Meta ” شناخته می‌شود و به کاربران امکان می‌دهد تا با استفاده از توصیفات زبان طبیعی، تصاویر خلاقانه‌ای ایجاد کنند.

به گزارش تکناک و به نقل از سایت ،Techcrunch ،این سیستم، که شباهت‌هایی به DALL-E از OpenAI، Midjourney و Stable Diffusion دارد، توسط یک مدل تولید تصویر قدرتمند از متا به نام امو(Emu )پشتیبانی می‌شود. این سرویس قادر است تصاویر با وضوح بالا را از دستورات متنی تولید کند. برای کاربران در ایالات متحده، استفاده از این سرویس فعلاً رایگان بوده و به ایجاد چهار تصویر در هر دستور محدود است.

متا در یک پست وبلاگی که امروز صبح منتشر شد، اظهار داشت:

از شنیدن داستان‌های کاربران درباره استفاده خلاقانه و سرگرم‌کننده از قابلیت تولید تصویر هوش مصنوعی تصور در چت‌ها، بسیار خوشحال شده‌ایم. امروز، ما دسترسی به تصور را فراتر از چت‌ها گسترش می‌دهیم. در حالی که تجربه پیام‌رسانی ما برای تعاملات شوخی‌آمیز و دوطرفه طراحی شده، اکنون کاربران می‌توانند تصاویر را به صورت رایگان در وب نیز ایجاد کنند.

در گذشته ای نه چندان دور، ابزارهای تولید تصویر متا با چالش‌هایی روبرو شدند، مانند مسئله‌ی نرم‌افزار تولید برچسب با تعصب نژادی که شرکت را در موقعیت دشواری قرار داد. این موضوع برای نویسندگان و کاربران سوالاتی را در مورد “Imagine with Meta,” به وجود آورده است، به ویژه در خصوص اقدامات پیشگیرانه‌ای که ممکن است برای جلوگیری از تکرار چنین مشکلاتی اتخاذ شده باشد. متاسفانه، قبل از راه‌اندازی این ابزار، فرصتی برای آزمایش آن در اختیار متخصصین مستقل این حوزه قرار نگرفته است

متا وعده داده است که در هفته‌های آینده برای افزایش شفافیت و قابلیت ردیابی، به تصاویر تولید شده توسط “Imagine with Meta,” واترمارک‌های نامرئی اضافه کند. این واترمارک‌ها با استفاده از مدل‌های هوش مصنوعی ساخته شده و قابل تشخیص با مدل‌های متناظر هستند. هنوز مشخص نیست که آیا مدل تشخیص برای استفاده عموم منتشر خواهد شد یا خیر. در حال حاضر، تنها یک واترمارک قابل مشاهده وجود دارد.

متا در یک پست اعلام کرده است که واترمارک‌های (نشان‌های آبی) مقاومت زیادی در برابر تغییرات رایج تصویر مانند برش، تغییر اندازه، تغییر رنگ (روشنایی، کنتراست و غیره)، عکس‌های صفحه، فشرده‌سازی تصویر، نویز، و پوشش‌های استیکر دارند. هدف متا این است که از این نشان‌گذاری نامرئی در بسیاری از محصولات خود که تصاویر تولید شده توسط هوش مصنوعی را شامل می‌شوند، در آینده استفاده کند.

استفاده از تکنیک‌های نشان‌گذاری درتصاویر تولیدی توسط هوش مصنوعی چیز جدیدی نیست. استارتاپ فرانسوی Imatag یک ابزار نشان‌گذاری ارائه می‌دهد که مدعی است تحت تأثیر تغییر اندازه، برش، ویرایش، یا فشرده‌سازی تصاویر قرار نمی‌گیرد. Steg.AI ، شرکت دیگری است که از مدل‌های هوش مصنوعی برای اعمال نشان‌های مقاوم در برابر تغییر اندازه و ویرایش‌های دیگر استفاده می‌کند. مایکروسافت و گوگل نیز استانداردها و فناوری‌های نشان‌گذاری مبتنی بر هوش مصنوعی را پذیرفته‌اند. در همین راستا، Shutterstock و Midjourney به توافقی برای جاسازی نشانگرهایی رسیده‌اند که نشان می‌دهند محتوای آن‌ها توسط ابزارهای هوش مصنوعی تولیدی ساخته شده است.

با افزایش فشار بر شرکت‌های فناوری برای ایجاد شفافیت بیشتر در مورد محتوای تولید شده توسط هوش مصنوعی ، به ویژه در پرتو انتشار گسترده دیپ‌فیک‌ها و تصاویر سوءاستفاده از کودکان تولید شده توسط هوش مصنوعی – اداره فضای مجازی چین قوانینی وضع کرده است که نیازمند نشان‌گذاری محتوای تولید شده توسط تولیدکنندگان هوش مصنوعی، از جمله تولیدکنندگان متن و تصویر، بدون تأثیر بر استفاده کاربران است. همچنین در جلسات اخیر کمیته سنای آمریکا، سناتور کریستن سینما (I-AZ) بر نیاز به شفافیت در هوش مصنوعی تولیدی تأکید کرده است.