شرکت گوگل با بهروزرسانی مدل تولید ویدیوی Veo 3.1، قابلیت ساخت ویدیو با تصاویر مرجع را به آن اضافه کرد.
به گزارش سرویس فناوری تکناک، این قابلیت دقت، کنترل و شخصیسازی خروجی را به طور چشمگیری افزایش میدهد و یک گام تازه در مسیر رقابت ابزارهای ویدیوسازی هوش مصنوعی محسوب میشود.
این قابلیت هماکنون برای کاربران موبایل و دسکتاپ فعال شده و گوگل اعلام کرده است که هدف آن، نزدیکتر کردن نتیجه نهایی به تصورات دقیق کاربر و کاهش تلاشهای تکراری برای رسیدن به خروجی مطلوب است.
طبق توضیحات منتشرشده، کاربران همچنان میتوانند تنها با پرامپتهای متنی ویدیو بسازند، اما اکنون امکان اضافه کردن یک یا چند تصویر مرجع فراهم شده است تا Veo بتواند عناصر بصری مانند ترکیببندی، سبک هنری، چهره، رنگبندی یا حتی نورپردازی را از روی تصویر ورودی استخراج و در ویدیو پیاده کند. این ویژگی نهتنها فرایند تولید را سریعتر و دقیقتر میکند، بلکه به سازندگان محتوا اجازه میدهد ایدههای شخصی یا تصاویر اختصاصی خود را در قالب ویدیوهای جدید بازتولید کنند و کنترل بیشتری بر نتیجه داشته باشند.
شرکت گوگل در شبکه اجتماعی X اعلام کرده که این ویژگی بخشی از برنامه توسعه گستردهتر Veo 3 است و این مدل قرار است به ابزار اصلی کاربران برای تولید کلیپهای هوش مصنوعی تبدیل شود. این شرکت در ماههای اخیر بهصورت عمومی بیش از گذشته روی قابلیتهای پیشرفته Veo مانور داده و حتی یک آگهی تبلیغاتی کامل را با همین فناوری تولید کرده است؛ ویدیویی که به گفته نویسندگان اگر بیننده از قبل مطلع نمیشد، تشخیص هوش مصنوعی بودن آن تقریباً غیرممکن بود. گوگل این سطح از کیفیت را نشانهای از بلوغ سریع فناوری تولید ویدیو با هوش مصنوعی میداند، هرچند معتقد است که همچنان در «مرحلههای ابتدایی» این مسیر قرار دارد.
برای استفاده از Veo، کاربران باید از طریق Google Gemini وارد شوند. نسخه رایگان امکان ساخت ویدیو را ارائه میدهد اما امکانات حرفهای، مدتزمانهای طولانیتر و گزینههای پیشرفته تنها در اشتراکهای AI Pro و AI Ultra فعال است. همچنین گوگل اعلام کرده است که دارندگان جدید گوشیهای پیکسل و دانشجویان در برخی کشورها، امکان استفاده رایگان از این نسخهها را دریافت میکنند.
گوگل تلاش دارد با این بهروزرسانی، جایگاه مدل Veo 3.1 را در برابر رقبای قدرتمندی مانند Runway و OpenAI Sora تقویت کند و تجربه تولید ویدیوهای هوش مصنوعی را یک گام دیگر به سطح مجموعههای حرفهای تولید محتوا نزدیکتر نماید؛ اقدامی که میتواند مسیر بازار ویدیوهای هوش مصنوعی را در سالهای آینده تغییر دهد.

















