آمازون با هوش مصنوعی مولد تصویر Titan از راه می‌رسد

هوش مصنوعی مولد تصویر Titan آمازون به توسعه‌دهندگان امکان می‌دهد تا برنامه‌های ایجاد تصاویر با هوش مصنوعی بسازند و ویژگی‌های واترمارک نامرئی را به تصاویر اضافه کنند.

به‌گزارش تک‌ناک، آمازون با انتشار مولد تصویر Titan برای تبدیل متن به تصویر، به نبرد ایجاد تصاویر با هوش مصنوعی می‌پیوندد. در همایش AWS re:Invent اعلام شد که مولد تصویر Titan می‌تواند تصاویری واقعی با کیفیت استودیویی خلق کند. مولد تصویر Titan برنامه یا وب‌سایتی مستقل نیست؛ بلکه ابزاری است که توسعه‌دهندگان می‌توانند بر‌اساس آن ژنراتورهای تصویر خود را با استفاده از این مدل ایجاد کنند. ناگفته نماند که توسعه‌دهندگان برای استفاده از آن به دسترسی به Amazon Bedrock نیاز دارند.

ورج می‌نویسد که سوامی سیواسوبرامانیان، معاون رئیس AWS در بخش یادگیری ماشین، در سخنرانی اصلی خود، مولد تصویر Titan را به‌صورت پیش‌نمایش معرفی و به توانایی این مدل در ایجاد تصویر از متن طبیعی و تغییر پس‌زمینه اشاره کرد.

این مدل مستقیماً برای مشتریان سازمانی طراحی شده است و خلاف ژنراتورهای تصویر معروف موجود مانند DALL-E شرکت OpenAI که تأکید بیشتری روی مصرف‌کنندگان می‌کنند، هدفمندانه ویژه‌ی متشریان سازمانی است.

تمام تصاویر مولد تصویر Titan به‌طور خودکار شامل واترمارک نامرئی هستند. واسی فیلومین، معاون رئیس AWS در‌زمینه‌ی هوش مصنوعی مولد، به ورج گفت که این قسمتی از تعهدات داوطلبانه‌ای محسوب می‌شود که آمازون در ماه ژوئیه با کاخ‌سفید امضا کرده است.

فیلومین در مصاحبه‌ای اعلام کرد:

به‌دنبال روشی بودیم تا بتوانیم تصویر تولید‌شده با هوش مصنوعی و به‌طور خاص ابزار مولد تصویر Titan را علامت گذاری کنیم که تداخلی با تصاویر بصری نداشته باشد و تأخیری در آن به‌چشم نخورد و نتوان آن را بُرش دارد و فشرده‌ کرد.

وی افزود که علامت واتر‌مارک به متادیتای فایل محدود نیست. با‌این‌حال، مسئله مربوط به تشخیص علامت واترمارک است. آمازون رابط برنامه‌نویسی (API) ایجاد کرده است که افراد می‌توانند به آن متصل شوند و تصویر را وارد و منشأ تصویر را بررسی کنند.

فیلومین افزود Titan محصولی نهایی نیست؛ بلکه نوعی مدل است؛ بنابراین، توسعه‌دهندگانی که با استفاده از مولد تصویر Titan محصولی تولید می‌کنند، درباره‌ی چگونگی ارائه‌ی این اطلاعات به کاربران تصمیم خواهند گرفت.

واترمارک‌گذاری یا شناسایی محتوا به‌عنوان محصولی از هوش مصنوعی، بخشی مهم از دستور اجرایی جو بایدن، رئیس‌جمهور ایالات متحده‌ی آمریکا، درباره‌ی هوش مصنوعی است. برای رفع این مسئله، شرکت‌هایی مانند مایکروسافت و ادوبی سیستم اعتبار محتوا را به‌کار برده‌اند؛ سیستمی که کمیته‌ی اصالت واقعیت محتوا و منشأ (C2PA) توسعه داده است. ادوبی با ایجاد آیکونی برای نشان‌دادن اعتبار محتوا در محتوای تصویری و ویدئویی، این فرایند را پیش می‌برد.

سیواسوبرامانیان نیز اعلام کرد که مدل‌های دیگری از تایتان در‌دسترس عمومی قرار می‌گیرند؛ ازجمله Titan Text Lite که مدلی کوچک‌تر است و برای وظایف سبک تولید متن مانند نوشتن کپی استفاده می‌شود و نیز Text Express که برای استفاده‌های بزرگ‌تر مانند برنامه‌های گفت‌وگومحور است. آمازون نیز تضمین کپی‌رایت را به مشتریانی که از مدل‌های پایه‌ی تایتان آن استفاده می‌کنند (از‌جمله متن به تصویر)، گسترش خواهد داد.

همچنین، به افرادی که از سایر برنامه‌های هوش مصنوعی ساخت آمازون استفاده کنند؛ حتی اگر اپلیکیشن از مدل پایه‌ی دیگری باشد که در مخزن مدل هوش مصنوعی Bedrock آمازون مانند Llama 2 از Meta یا Claude 2 از Anthropic استفاده کرده باشد، پوشش قانونی ارائه خواهد داد. این برنامه‌ها عبارت‌اند از: AWS HealthScribe ،‌CodeWhisperer ،‌Amazon Personalize ،‌Amazon Lex و Amazon Connect Contact Lens می‌شوند.