هوش مصنوعی مولد تصویر Titan آمازون به توسعهدهندگان امکان میدهد تا برنامههای ایجاد تصاویر با هوش مصنوعی بسازند و ویژگیهای واترمارک نامرئی را به تصاویر اضافه کنند.
بهگزارش تکناک، آمازون با انتشار مولد تصویر Titan برای تبدیل متن به تصویر، به نبرد ایجاد تصاویر با هوش مصنوعی میپیوندد. در همایش AWS re:Invent اعلام شد که مولد تصویر Titan میتواند تصاویری واقعی با کیفیت استودیویی خلق کند. مولد تصویر Titan برنامه یا وبسایتی مستقل نیست؛ بلکه ابزاری است که توسعهدهندگان میتوانند براساس آن ژنراتورهای تصویر خود را با استفاده از این مدل ایجاد کنند. ناگفته نماند که توسعهدهندگان برای استفاده از آن به دسترسی به Amazon Bedrock نیاز دارند.
ورج مینویسد که سوامی سیواسوبرامانیان، معاون رئیس AWS در بخش یادگیری ماشین، در سخنرانی اصلی خود، مولد تصویر Titan را بهصورت پیشنمایش معرفی و به توانایی این مدل در ایجاد تصویر از متن طبیعی و تغییر پسزمینه اشاره کرد.
این مدل مستقیماً برای مشتریان سازمانی طراحی شده است و خلاف ژنراتورهای تصویر معروف موجود مانند DALL-E شرکت OpenAI که تأکید بیشتری روی مصرفکنندگان میکنند، هدفمندانه ویژهی متشریان سازمانی است.
تمام تصاویر مولد تصویر Titan بهطور خودکار شامل واترمارک نامرئی هستند. واسی فیلومین، معاون رئیس AWS درزمینهی هوش مصنوعی مولد، به ورج گفت که این قسمتی از تعهدات داوطلبانهای محسوب میشود که آمازون در ماه ژوئیه با کاخسفید امضا کرده است.
فیلومین در مصاحبهای اعلام کرد:
بهدنبال روشی بودیم تا بتوانیم تصویر تولیدشده با هوش مصنوعی و بهطور خاص ابزار مولد تصویر Titan را علامت گذاری کنیم که تداخلی با تصاویر بصری نداشته باشد و تأخیری در آن بهچشم نخورد و نتوان آن را بُرش دارد و فشرده کرد.
وی افزود که علامت واترمارک به متادیتای فایل محدود نیست. بااینحال، مسئله مربوط به تشخیص علامت واترمارک است. آمازون رابط برنامهنویسی (API) ایجاد کرده است که افراد میتوانند به آن متصل شوند و تصویر را وارد و منشأ تصویر را بررسی کنند.
فیلومین افزود Titan محصولی نهایی نیست؛ بلکه نوعی مدل است؛ بنابراین، توسعهدهندگانی که با استفاده از مولد تصویر Titan محصولی تولید میکنند، دربارهی چگونگی ارائهی این اطلاعات به کاربران تصمیم خواهند گرفت.
واترمارکگذاری یا شناسایی محتوا بهعنوان محصولی از هوش مصنوعی، بخشی مهم از دستور اجرایی جو بایدن، رئیسجمهور ایالات متحدهی آمریکا، دربارهی هوش مصنوعی است. برای رفع این مسئله، شرکتهایی مانند مایکروسافت و ادوبی سیستم اعتبار محتوا را بهکار بردهاند؛ سیستمی که کمیتهی اصالت واقعیت محتوا و منشأ (C2PA) توسعه داده است. ادوبی با ایجاد آیکونی برای نشاندادن اعتبار محتوا در محتوای تصویری و ویدئویی، این فرایند را پیش میبرد.
سیواسوبرامانیان نیز اعلام کرد که مدلهای دیگری از تایتان دردسترس عمومی قرار میگیرند؛ ازجمله Titan Text Lite که مدلی کوچکتر است و برای وظایف سبک تولید متن مانند نوشتن کپی استفاده میشود و نیز Text Express که برای استفادههای بزرگتر مانند برنامههای گفتوگومحور است. آمازون نیز تضمین کپیرایت را به مشتریانی که از مدلهای پایهی تایتان آن استفاده میکنند (ازجمله متن به تصویر)، گسترش خواهد داد.
همچنین، به افرادی که از سایر برنامههای هوش مصنوعی ساخت آمازون استفاده کنند؛ حتی اگر اپلیکیشن از مدل پایهی دیگری باشد که در مخزن مدل هوش مصنوعی Bedrock آمازون مانند Llama 2 از Meta یا Claude 2 از Anthropic استفاده کرده باشد، پوشش قانونی ارائه خواهد داد. این برنامهها عبارتاند از: AWS HealthScribe ،CodeWhisperer ،Amazon Personalize ،Amazon Lex و Amazon Connect Contact Lens میشوند.