گوگل در کنفرانس توسعهدهندگان I/O که روز سهشنبه برگزار شد، اعلام کرد که Veo، آخرین مدل هوش مصنوعی تولید ویدیوی آنها، میتواند ویدیوهای «باکیفیت» با رزولوشن ۱۰۸۰p و با مدت زمان بیش از یک دقیقه را در طیف وسیعی از سبکهای تصویری و سینمایی تولید کند.
به گزارش تکناک،طبق بیانیه مطبوعاتی گوگل، Veo «درک پیشرفتهای از زبان طبیعی» دارد و این مدل را قادر میسازد تا اصطلاحات سینمایی مانند «تایملپس» یا «تصاویر هوایی از منظره» را درک کند. کاربران میتوانند خروجی موردنظر خود را با استفاده از پیامهای متنی، تصویری یا ویدیویی هدایت کنند و گوگل میگوید ویدیوهای حاصل شده «منسجمتر و همگونتر» هستند و حرکت واقعگرایانهتری را برای افراد، حیوانات و اشیاء در طول نماها به تصویر میکشند.
دیمیس حسابیس، مدیرعامل DeepMind گوگل، در یک پیشنمایش مطبوعاتی در روز دوشنبه گفت که نتایج ویدیو را میتوان با استفاده از پیامهای اضافی اصلاح کرد و گوگل در حال بررسی ویژگیهای اضافی برای فعال کردن Veo برای تولید استوریبردها و صحنههای طولانیتر است.
همانطور که در مورد بسیاری از پیشنمایشهای مدلهای هوش مصنوعی معمول است، اکثر افرادی که امیدوارند خودشان Veo را امتحان کنند، احتمالا باید کمی صبر کنند.
گوگل اعلام کرده است که در حال دعوت از فیلمسازان و سازندگان محتوای منتخب برای آزمایش این مدل است تا ببیند چگونه میتواند به بهترین شکل از افراد خلاق پشتیبانی کند. این شرکت تاکید کرده که این همکاریها به گوگل کمک خواهد کرد تا اطمینان حاصل کند که «سازندگان در توسعه فناوریهای هوش مصنوعی گوگل نقشی فعال دارند.
همچنین برخی از ویژگیهای Veo در یک پیشنمایش خصوصی درون VideoFX در «هفتههای آینده» در اختیار «سازندگان محتوای منتخب» قرار خواهد گرفت.
این یکی از چندین مدل تولید ویدیویی است که گوگل در طول چند سال گذشته تولید کرده است، از Phenaki و Imagen Video که ویدیوهای خام و اغلب تحریفشده تولید میکردند تا مدل Lumiere که در ژانویه سال جاری به نمایش گذاشت.
Lumiere یکی از تاثیرگذارترین مدلهایی بود که قبل از معرفی Sora در فوریه دیده بودیم، و گوگل میگوید Veo حتی توانایی بیشتری در درک محتوای ویدیو، شبیهسازی فیزیک دنیای واقعی، رندر خروجی با کیفیت بالا و موارد دیگر دارد.
در همین حال، OpenAI در حال حاضر Sora را به هالیوود معرفی میکند و قصد دارد آن را در اواخر امسال برای عموم منتشر کند، در حالی که پیش از این در مارس اعلام کرده بود که ممکن است در «چند ماه» آماده شود. این شرکت همچنین به دنبال افزودن صدا به Sora است و ممکن است این مدل را به طور مستقیم در اپلیکیشنهای ویرایش ویدیو مانند Adobe Premiere Pro در دسترس قرار دهد. با توجه به اینکه Veo نیز به عنوان ابزاری برای فیلمسازان معرفی میشود، پیشتازی OpenAI ممکن است کار را برای پروژه گوگل سختتر کند.