متا ابزار جدیدی به نام MovieGen را معرفی کرده است که به کاربران اجازه میدهد تا ویدئوهای بسیار باکیفیت و واقعگرایانه تولید کند.
بهگزارش تکناک، متا خانوادهی مدلهای هوش مصنوعی MovieGen را معرفی کرد. این مدلها با بهرهگیری از تکنیکهای یادگیری ماشین، ویدئوهای واقعگرایانهی باکیفیت را براساس ورودیهای متنی میتوانند تولید کنند. خانوادهی MovieGen شامل دو مدل تخصصی میشود: یکی MovieGen Video و دیگری MovieGen Audio.
- MovieGen Video مدل ترانسفورمری ۳۰ میلیارد پارامتری است که تصاویر و ویدئوهای باکیفیت و با رزولوشن خیرهکننده و حداکثر ۱۶ ثانیه و نرخ ۱۶ فریمبرثانیه را ازطریق دستور متنی تولید میکند.
- MovieGen Audio نیز مدل ترانسفورمری ۱۳ میلیارد پارامتری است که صداهای باکیفیت و همگام با ویدئوهای ورودی میتواند تولید کند. این مدل با استفاده از دستورهای متنی، میتواند انواع صداها ازجمله صداهای محیط و موسیقی پسزمینه و افکتهای صوتی را تولید کند.
نئووین مینویسد که این مدلها صرفاً برای ساخت ویدئوهای کاملاً جدید طراحی نشدهاند. شما میتوانید با استفاده از دستورهای متنی ساده، ویدئوهای موجود را ویرایش کنید. MovieGen به شما اجازه میدهد تا علاوهبر تغییرات کلی مثل تغییر پسزمینه یا سبک، ویرایشهای جزئیتری مانند اضافه و حذف یا جایگزین کردن عناصر را انجام دهید. برای مثال، فرض کنید ویدئویی دارید که شخصی در آن توپی را پرتاب میکند. با دستوری ساده، میتوانید ویدئو را طوری تغییر دهید که شخص هندوانه پرتاب کند؛ درحالیکه بقیهی ویدئو بدون تغییر باقی میماند.
مدلهای MovieGen به کاربران امکان میدهند تا ویدئوهای سفارشیسازیشدهای تولید کنند. با ارائهی تصویری از فرد مدنظر و دستور متنی، این مدلها میتوانند ویدئوهایی شخصیسازیشده ایجاد کنند که هم هویت بصری فرد را حفظ و هم حرکات طبیعی او را شبیهسازی کنند. متا ادعا میکند که این مدلها در حفظ ویژگیهای شخصیتی و حرکات طبیعی در ویدئوهای تولیدشده، عملکردی بسیار پیشرفته دارند.
متا مدعی است که این مدلها ویدئوهایی باکیفیتتر از سایر مدلهای موجود در بازار، ازجمله سورا OpenAI و Gen-3 شرکت Runway میتوانند تولید کنند. درحالحاضر، متا در حال همکاری با متخصصان خلاق برای ارتقای بیشتر این مدل پیش از انتشار عمومی آن است.