هوش مصنوعی مولد ویدئوی Veo گوگل رونمایی شد

گوگل در کنفرانس توسعه‌دهندگان I/O که روز سه‌شنبه برگزار شد، اعلام کرد که Veo، آخرین مدل هوش مصنوعی تولید ویدیوی آن‌ها، می‌تواند ویدیوهای «باکیفیت» با رزولوشن ۱۰۸۰p و با مدت زمان بیش از یک دقیقه را در طیف وسیعی از سبک‌های تصویری و سینمایی تولید کند.

به گزارش تک‌ناک،طبق بیانیه مطبوعاتی گوگل، Veo «درک پیشرفته‌ای از زبان طبیعی» دارد و این مدل را قادر می‌سازد تا اصطلاحات سینمایی مانند «تایم‌لپس» یا «تصاویر هوایی از منظره» را درک کند. کاربران می‌توانند خروجی موردنظر خود را با استفاده از پیام‌های متنی، تصویری یا ویدیویی هدایت کنند و گوگل می‌گوید ویدیوهای حاصل شده «منسجم‌تر و همگون‌تر» هستند و حرکت واقع‌گرایانه‌تری را برای افراد، حیوانات و اشیاء در طول نماها به تصویر می‌کشند.

دیمیس حسابیس، مدیرعامل DeepMind گوگل، در یک پیش‌نمایش مطبوعاتی در روز دوشنبه گفت که نتایج ویدیو را می‌توان با استفاده از پیام‌های اضافی اصلاح کرد و گوگل در حال بررسی ویژگی‌های اضافی برای فعال کردن Veo برای تولید استوری‌بردها و صحنه‌های طولانی‌تر است.

همانطور که در مورد بسیاری از پیش‌نمایش‌های مدل‌های هوش مصنوعی معمول است، اکثر افرادی که امیدوارند خودشان Veo را امتحان کنند، احتمالا باید کمی صبر کنند.

گوگل اعلام کرده است که در حال دعوت از فیلم‌سازان و سازندگان محتوای منتخب برای آزمایش این مدل است تا ببیند چگونه می‌تواند به بهترین شکل از افراد خلاق پشتیبانی کند. این شرکت تاکید کرده که این همکاری‌ها به گوگل کمک خواهد کرد تا اطمینان حاصل کند که «سازندگان در توسعه فناوری‌های هوش مصنوعی گوگل نقشی فعال دارند.

همچنین برخی از ویژگی‌های Veo در یک پیش‌نمایش خصوصی درون VideoFX در «هفته‌های آینده» در اختیار «سازندگان محتوای منتخب» قرار خواهد گرفت.

این یکی از چندین مدل تولید ویدیویی است که گوگل در طول چند سال گذشته تولید کرده است، از Phenaki و Imagen Video که ویدیوهای خام و اغلب تحریف‌شده تولید می‌کردند تا مدل Lumiere که در ژانویه سال جاری به نمایش گذاشت.

Lumiere یکی از تاثیرگذارترین مدل‌هایی بود که قبل از معرفی Sora در فوریه دیده بودیم، و گوگل می‌گوید Veo حتی توانایی بیشتری در درک محتوای ویدیو، شبیه‌سازی فیزیک دنیای واقعی، رندر خروجی با کیفیت بالا و موارد دیگر دارد.

در همین حال، OpenAI در حال حاضر Sora را به هالیوود معرفی می‌کند و قصد دارد آن را در اواخر امسال برای عموم منتشر کند، در حالی که پیش از این در مارس اعلام کرده بود که ممکن است در «چند ماه» آماده شود. این شرکت همچنین به دنبال افزودن صدا به Sora است و ممکن است این مدل را به طور مستقیم در اپلیکیشن‌های ویرایش ویدیو مانند Adobe Premiere Pro در دسترس قرار دهد. با توجه به اینکه Veo نیز به عنوان ابزاری برای فیلمسازان معرفی می‌شود، پیشتازی OpenAI ممکن است کار را برای پروژه گوگل سخت‌تر کند.

برچسب‌ها: p6