شرکت گوگل با معرفی پلتفرم “Vertex AI Media Studio”، گامی تازه در همگانیسازی تولید محتوای ویدیویی (democratization) برداشته است.
به گزارش تکناک، این پلتفرم که بر پایه Vertex AI در زیرساخت ابری گوگل (Google Cloud) توسعه یافته است، تنها با یک دستور متنی و با ترکیب چندین مدل پیشرفته، کلیه مراحل تولید ویدیو از جمله ایجاد تصویر، صداگذاری و موسیقی را بدون نیاز به مهارتهای ویرایش ویدیو یا دانش کدنویسی مدیریت میکند.
فرایند تولید با ایجاد یک تصویر توسط Imagen 3، مدل تولید تصویر گوگل آغاز میشود. سپس این تصویر با استفاده از Veo 2، مدل جدید تولید ویدیوی گوگل، به یک ویدیو تبدیل میشود. Veo 2 امکان سفارشیسازی گستردهای را از انتخاب نوع حرکت دوربین (مانند نماهای پهپادی یا حرکات افقی دوربین) گرفته تا تنظیم نرخ فریم و مدت زمان ویدیو، در اختیار کاربران قرار میدهد. همچنین در صورت وجود عناصر ناخواسته، میتوان از قابلیت مشابه Magic Eraser برای حذف آنها استفاده کرد؛ قابلیتی که پیشتر در گوشیهای Pixel معرفی شده بود.
پلتفرم Media Studio پس از آمادهسازی بخش بصری، با بهرهگیری از Chirp، مدل تبدیل متن به گفتار گوگل، صداگذاری را انجام میدهد. در نهایت، مدل Lyria — که به طور مشترک توسط Google DeepMind و YouTube توسعه یافته است — قطعه موسیقی متن ویدیو را تولید میکند.
نتیجه نهایی، ویدیویی کامل و آماده برای اشتراکگذاری است، که از کیفیت تصویر و صدای حرفهای برخوردار بوده و تمامی مراحل آن در یک فضای کاری یکپارچه در Vertex AI Studio انجام شده است؛ همان کنسولی که توسعهدهندگان میتوانند در آن جدیدترین مدلهای Gemini گوگل را نیز آزمایش کنند.
Vertex AI به عنوان پلتفرم اصلی این ابزارها، دسترسی به مدلهای Gemini را نیز فراهم کرده است؛ مدلهایی که قادر هستند دادههای چندرسانهای مانند: متن، تصویر و کد را پردازش و خروجیهای متنوعی تولید کنند. توسعهدهندگان و کاربران غیر فنی میتوانند از طریق محیط آزمایشی Vertex AI Studio، دست به آزمون و خطای پرامپتها بزنند و مدلها را برای نیازهای خاص خود بهینهسازی کنند.
هرچند این ابزارهای جدید نوید تسهیل چشمگیر فرایند تولید محتوا را میدهند، اما همچنان نگرانیهایی پیرامون اصالت آثار، نقش خلاقیت انسانی و استفاده مسئولانه از هوش مصنوعی را برمیانگیزند. با وجود این، گوگل بر این باور است که بسیاری از کاربران — به ویژه افرادی که فاقد مهارتهای حرفهای ویرایش هستند — از امکان ساخت آسان ویدیوهای باکیفیت و منطبق بر هویت برند خود تنها با چند کلیک، استقبال خواهند کرد.