ابزارهای هوش مصنوعی مولد ادوبی برای فیلم‌سازی؛ آینده‌ فیلم‌سازی دیجیتال

ادوبی با معرفی ابزارهای هوش مصنوعی مولد برای فیلم‌سازی، قدرتی کم‌نظیر به فیلم‌سازان می‌دهد تا تجربه‌های صوتی و بصری جدیدی خلق کنند.

به گزارش تک‌ناک، ادوبی ابزارهای جدید مبتنی‌بر هوش مصنوعی مولد برای فیلم‌سازی معرفی کرده است که روش‌های سرگرم‌کننده‌ای برای ساخت جلوه‌های صوتی و کنترل خروجی‌های ویدیویی تولیدشده ارائه می‌دهد. علاوه‌بر دستورهای متنی معمول که در مدل‌های Firefly برای ساخت یا ویرایش محتوا استفاده می‌شوند، حالا کاربران می‌توانند از ضبط صداهای شبیه آوا‌نما (Onomatopoeia) برای تولید صداهای اختصاصی استفاده و با بارگذاری ویدئوهای مرجع، حرکات موجود در ویدئوهای تولیدی Firefly را هدایت کنند.

ورج می‌نویسد ابزار Generate Sound Effects که به‌صورت بتا در اپلیکیشن Firefly در دسترس قرار گرفته، با تصاویر ضبط‌شده یا تولیدشده قابلیت استفاده دارد و در مقایسه با ابزار ویدئویی Veo 3 گوگل، کنترل بیشتری بر تولید صدا ارائه می‌دهد. رابط کاربری این ابزار شبیه تایم‌لاین تدوین ویدئو است و به کاربران اجازه می‌دهد تا جلوه‌های صوتی را هماهنگ با زمان‌بندی تصاویر آپلودشده بسازند.

برای نمونه، کاربر می‌تواند ویدئویی از اسب در حال حرکت روی جاده پخش و هم‌زمان صدای «کلیپ کلپ» (صدای قدم‌زدن سم‌ها) را ضبط کند و در کنار آن، توضیحی متنی مانند «سم‌ها روی بتن» بنویسد. ابزار سپس چهار گزینه برای جلوه صوتی ایجاد می‌کند تا یکی را انتخاب کنند.

این قابلیت برپایه پروژه آزمایشی Project Super Sonic توسعه داده شده است که ادوبی در رویداد Max ماه اکتبر به نمایش گذاشته بود. ابزار یادشده برای تولید گفتار کاربرد ندارد؛ اما از ایجاد صداهای ضربه‌ای مانند شکستن شاخه و قدم‌زدن و بازوبسته‌شدن زیپ پشتیبانی می‌کند و توانایی ساخت صداهای محیطی مانند صدای طبیعت و شلوغی شهر را نیز دارد.

کنترل‌های پیشرفته‌تری نیز برای ابزار Firefly Text-to-Video ارائه شده‌اند. ویژگی Composition Reference به کاربران اجازه می‌دهد تا همراه با دستور متنی، ویدئویی مرجع نیز بارگذاری کنند تا ترکیب‌بندی آن در ویدئو تولیدی بازتاب پیدا کند. این کار در مقایسه با نوشتن چندباره دستورهای متنی برای رسیدن به نتیجه دلخواه، کار را آسان‌تر می‌کند.

قابلیت Keyframe Cropping نیز امکان بارگذاری و کراپ کردن تصاویر فریم اول و آخر را فراهم می‌کند تا Firefly ویدئویی بین این دو فریم تولید کند. همچنین، Style Presets جدیدی اضافه شده‌اند که سبک‌های بصری آماده مانند انیمه و آرت وکتور و کلی‌میشن را به‌راحتی در اختیار کاربر می‌گذارند.

این سبک‌های آماده فقط در مدل هوش مصنوعی ویدئویی اختصاصی ادوبی کاربرد دارند. با‌این‌حال، کیفیت خروجی‌ها جای پیشرفت دارد؛ مثلاً در دمو زنده‌ای که خبرنگار ورج مشاهده کرده، گزینه کلی‌میشن بیشتر شبیه انیمیشن سه‌بعدی دهه ۲۰۰۰ به‌ نظر می‌رسید. با‌این‌حال، ادوبی همچنان به پشتیبانی از مدل‌های هوش مصنوعی رقیب در ابزارهای خود ادامه می‌دهد.

الکساندرو کاستین، مدیر بخش هوش مصنوعی مولد ادوبی، گفته است که کنترل‌ها و سبک‌های مشابه ممکن است در آینده برای مدل‌های شخص ثالث نیز کاربرد داشته باشند. این موضوع نشان می‌دهد که ادوبی در تلاش است تا جایگاه خود را در صدر نرم‌افزارهای خلاقانه حفظ کند؛ حتی اگر درزمینه مدل‌های مولد، از رقبایی مانند OpenAI و Google عقب‌تر باشد