ادوبی با معرفی ابزارهای هوش مصنوعی مولد برای فیلمسازی، قدرتی کمنظیر به فیلمسازان میدهد تا تجربههای صوتی و بصری جدیدی خلق کنند.
به گزارش تکناک، ادوبی ابزارهای جدید مبتنیبر هوش مصنوعی مولد برای فیلمسازی معرفی کرده است که روشهای سرگرمکنندهای برای ساخت جلوههای صوتی و کنترل خروجیهای ویدیویی تولیدشده ارائه میدهد. علاوهبر دستورهای متنی معمول که در مدلهای Firefly برای ساخت یا ویرایش محتوا استفاده میشوند، حالا کاربران میتوانند از ضبط صداهای شبیه آوانما (Onomatopoeia) برای تولید صداهای اختصاصی استفاده و با بارگذاری ویدئوهای مرجع، حرکات موجود در ویدئوهای تولیدی Firefly را هدایت کنند.
ورج مینویسد ابزار Generate Sound Effects که بهصورت بتا در اپلیکیشن Firefly در دسترس قرار گرفته، با تصاویر ضبطشده یا تولیدشده قابلیت استفاده دارد و در مقایسه با ابزار ویدئویی Veo 3 گوگل، کنترل بیشتری بر تولید صدا ارائه میدهد. رابط کاربری این ابزار شبیه تایملاین تدوین ویدئو است و به کاربران اجازه میدهد تا جلوههای صوتی را هماهنگ با زمانبندی تصاویر آپلودشده بسازند.
برای نمونه، کاربر میتواند ویدئویی از اسب در حال حرکت روی جاده پخش و همزمان صدای «کلیپ کلپ» (صدای قدمزدن سمها) را ضبط کند و در کنار آن، توضیحی متنی مانند «سمها روی بتن» بنویسد. ابزار سپس چهار گزینه برای جلوه صوتی ایجاد میکند تا یکی را انتخاب کنند.

این قابلیت برپایه پروژه آزمایشی Project Super Sonic توسعه داده شده است که ادوبی در رویداد Max ماه اکتبر به نمایش گذاشته بود. ابزار یادشده برای تولید گفتار کاربرد ندارد؛ اما از ایجاد صداهای ضربهای مانند شکستن شاخه و قدمزدن و بازوبستهشدن زیپ پشتیبانی میکند و توانایی ساخت صداهای محیطی مانند صدای طبیعت و شلوغی شهر را نیز دارد.
کنترلهای پیشرفتهتری نیز برای ابزار Firefly Text-to-Video ارائه شدهاند. ویژگی Composition Reference به کاربران اجازه میدهد تا همراه با دستور متنی، ویدئویی مرجع نیز بارگذاری کنند تا ترکیببندی آن در ویدئو تولیدی بازتاب پیدا کند. این کار در مقایسه با نوشتن چندباره دستورهای متنی برای رسیدن به نتیجه دلخواه، کار را آسانتر میکند.
قابلیت Keyframe Cropping نیز امکان بارگذاری و کراپ کردن تصاویر فریم اول و آخر را فراهم میکند تا Firefly ویدئویی بین این دو فریم تولید کند. همچنین، Style Presets جدیدی اضافه شدهاند که سبکهای بصری آماده مانند انیمه و آرت وکتور و کلیمیشن را بهراحتی در اختیار کاربر میگذارند.
این سبکهای آماده فقط در مدل هوش مصنوعی ویدئویی اختصاصی ادوبی کاربرد دارند. بااینحال، کیفیت خروجیها جای پیشرفت دارد؛ مثلاً در دمو زندهای که خبرنگار ورج مشاهده کرده، گزینه کلیمیشن بیشتر شبیه انیمیشن سهبعدی دهه ۲۰۰۰ به نظر میرسید. بااینحال، ادوبی همچنان به پشتیبانی از مدلهای هوش مصنوعی رقیب در ابزارهای خود ادامه میدهد.
الکساندرو کاستین، مدیر بخش هوش مصنوعی مولد ادوبی، گفته است که کنترلها و سبکهای مشابه ممکن است در آینده برای مدلهای شخص ثالث نیز کاربرد داشته باشند. این موضوع نشان میدهد که ادوبی در تلاش است تا جایگاه خود را در صدر نرمافزارهای خلاقانه حفظ کند؛ حتی اگر درزمینه مدلهای مولد، از رقبایی مانند OpenAI و Google عقبتر باشد