گوگل با گسترش دسترسی به Veo، مولد ویدیوی هوش مصنوعی خود، امکان استفاده از این فناوری را برای مشتریان Google Cloud فراهم کرد.
به گزارش تکناک، این ابزار اکنون در مرحله پیشنمایش خصوصی برای کاربران پلتفرم توسعه هوش مصنوعی Vertex AI عرضه میشود.
گوگل اعلام کرده است که این ابزار جدید به شرکتهایی نظیر Quora اجازه میدهد از آن برای پلتفرم چتبات خود، Poe، استفاده کنند. علاوه بر این، شرکت Mondelez International، مالک برند Oreo، میتواند از این ابزار برای تولید محتوای تبلیغاتی با همکاری شرکای بازاریابی خود بهره ببرد.
به گفته اسپنسر چان، مدیر محصول Poe، این همکاریها میتواند امکانات خلاقانه بیشتری در حوزه هوش مصنوعی فراهم کند.
وی در بیانیهای گفت: «ما Poe را برای دموکراتیزه کردن دسترسی به بهترین مدلهای هوش مصنوعی مولد جهان ایجاد کردیم. از طریق همکاری با رهبرانی مانند گوگل، ما در حال گسترش قابلیتهای خلاقانه در تمامی حوزههای هوش مصنوعی هستیم.»
فهرست مطالب
قابلیتهای پیشرفته مولد ویدیوی هوش مصنوعی گوگل
مدل Veo که نخستین بار در آوریل معرفی شد، قادر به تولید کلیپهای کوتاه ویدیویی با کیفیت 1080p از حیوانات، اشیا و انسانها است. این کلیپها میتوانند تا شش ثانیه و با سرعت 24 یا 30 فریم بر ثانیه تولید شوند.
همچنین این ابزار قابلیت تولید انواع سبکهای بصری و سینمایی، از جمله تایملپس و نماهای منظره را دارد و میتواند ویدیوهای ایجادشده را ویرایش کند.
وارن بارکلی، مدیر ارشد مدیریت محصول در Google Cloud، درباره تأخیر در عرضه عمومی API این ابزار گفت: «ما مدل Veo را برای مشتریان سازمانی در Vertex AI تقویت و بهبود دادهایم تا آمادگی کامل برای استفاده شرکتی را داشته باشد.»
وی بیان کرد: «از امروز، کاربران میتوانند ویدیوهایی با کیفیت 720p و در نسبت ابعاد 16:9 و 9:16 ایجاد کنند. ما این روند بهبود را مشابه سایر مدلها، مانند Gemini، ادامه خواهیم داد.»
رقابت و محدودیتهای مولد ویدیوی هوش مصنوعی گوگل
مولد ویدیوی هوش مصنوعی گوگل علاوه بر درک جلوههای بصری (VFX)، تا حدی مفاهیم فیزیکی مانند دینامیک سیالات را نیز متوجه میشود. ابزار Veo از ویرایشهای ماسکشده و ترکیب کلیپها برای پروژههای طولانیتر پشتیبانی میکند.
با وجود این، مانند بسیاری از مدلهای مولد هوش مصنوعی، هنوز مشکلاتی نظیر ناپدیدشدن یا جابهجایی غیرمنطقی اشیا در ویدیوهای تولیدشده وجود دارد.
این ابزار با مدلهای پیشرویی مانند Sora از OpenAI و ابزارهایی از Adobe، Runway، Luma و Meta رقابت میکند. اما برخی از محدودیتها و ایرادات همچنان باقی مانده است، که از جمله آنها اشتباهات در فیزیک یا نقص در تنظیمات ویدیویی میباشد.
روش آموزش و چالشهای حقوقی
مدل Veo با استفاده از دادههای ویدیویی گسترده آموزش دیده است، اما گوگل اطلاعات دقیقی درباره منابع دادههای آموزشی ارائه نکرده است.
به گفته بارکلی، این مدل ممکن است طبق توافق با تولیدکنندگان محتوای YouTube از محتوای این پلتفرم نیز بهره گرفته باشد.
در این میان، تغییرات در شرایط خدمات گوگل طی سال گذشته به شرکت اجازه داده است تا از دادههای بیشتری برای آموزش مدلهای خود استفاده کند. این موضوع نگرانیهایی درباره حق نشر و استفاده از دادههای عمومی ایجاد کرده است.
برای کاهش این نگرانیها، گوگل فیلترهایی برای جلوگیری از تولید محتوای خشونتآمیز یا صریح در Veo اعمال کرده است. همچنین سیاست جبران خسارت گوگل از کاربران در برابر ادعاهای نقض حق نشر محافظت میکند.
عرضه تدریجی و آینده Veo
گوگل از ماه مه مولد ویدیوی هوش مصنوعی Veo را در برنامه دسترسی اولیه Google Labs برای تسترهای منتخب ارائه کرد و در سپتامبر این ابزار را برای تولید کلیپهای ششثانیهای در YouTube Shorts ادغام کرد.
همچنین گوگل با استفاده از فناوری اختصاصی SynthID، واترمارکهای نامرئی در ویدیوهای تولیدشده ایجاد کرده است تا از سوءاستفاده جلوگیری کند. هرچند این فناوری هنوز کامل نیست و برای شرکای ثالث در دسترس قرار ندارد.
به گفته بارکلی، این شرکت برنامهای برای عرضه سریع Veo ندارد و ترجیح میدهد ابتدا از بازخورد کاربران اولیه استفاده کند.
وی در این باره گفت: «ما اغلب محصولات را ابتدا در حالت پیشنمایش عرضه میکنیم تا از بازخوردهای دنیای واقعی برای بهبود عملکرد استفاده نماییم.»
در همین راستا، گوگل اعلام کرده است که Imagen 3، مولد تصویر پرچمدار این شرکت، اکنون برای تمامی کاربران Vertex AI بدون نیاز به لیست انتظار در دسترس است، هرچند برخی قابلیتهای پیشرفته آن همچنان تحت محدودیت قرار دارند.
نگرانیهای مربوط به خلاقیت و اشتغال
گسترش استفاده از ابزارهای مولد هوش مصنوعی مانند Veo نگرانیهایی درباره تأثیر آن بر مشاغل خلاق ایجاد کرده است.
طبق مطالعهای که در سال 2024 توسط Animation Guild انجام شد، بیش از 100,000 شغل در حوزه فیلم، تلویزیون و انیمیشن در ایالات متحده تا سال 2026 تحت تأثیر فناوری هوش مصنوعی قرار خواهند گرفت.
گوگل با اتخاذ رویکردی آهسته و محتاطانه تلاش میکند تا این نگرانیها را کاهش دهد و همزمان ابزارهای خود را بهبود بخشد.
دیدگاهها 1