ساخت ویدئو ۶۰ ثانیه ای با Sora یک ساعت زمان می‌برد

مدل هوش مصنوعی Sora که به‌تازگی OpenAI رونمایی کرده، ویدئوهای واقع‌گرایانه را از روی متن می‌تواند تولید کند. با‌این‌حال، مباحثات نشان می‌دهد که ساخت یک دقیقه ویدیو با این مدل بیش از یک ساعت طول می‌کشد.

به‌گزارش تک‌ناک، در‌حالی‌که زمان دقیق رندر ویدئو‌های تولیدی Sora مشخص نیست، در پستی در Reddit توضیح داده شده است که زمان رندر از روش‌های سنتی ساخت ویدئو بسیار بیشتر است.

باید بدانید این بحث‌ها بر‌اساس اطلاعات محدودی درگرفته است و محققان عمدتاً نمونه‌های پیش‌ساخته را به‌نمایش می‌گذارند و اجازه دسترسی عموم به دستورهای سفارشی را نمی‌دهند. طولانی‌ترین ویدئو نمایش‌داده‌شده، تنها 17 ثانیه طول داشت.

دیدگاه‌های مختلفی درباره این زمان‌های رندر به‌وجود آمده است. برخی از کاربران به غیرعملی‌بودن زمان‌های رندر طولانی، به‌ویژه هنگام تکرار چندین دستور، اشاره کردند. عده‌ای دیگر درباره دلایل احتمالی پشت زمان‌های رندر طولانی گمانه‌زنی کرده‌اند. یکی از کاربران با استناد به اظهارات سم آلتمن، مدیرعامل OpenAI، به نیاز به بودجه هنگفت اشاره کرد: «می‌توانم بفهمم که چرا او (سم آلتمن) اکنون 7 تریلیون دلار می‌خواهد.»

همچنین مقایسه‌هایی با مدل هوش مصنوعی دیگری که به‌تازگی معرفی شده است، یعنی Gemini 1.5 گوگل، انجام شده است که بر فضای رقابتی تأکید می‌کند. درنهایت، برخی از کاربران سعی کردند زمان‌های رندر را با مقایسه آن‌ها با انیمیشن‌های سنتی توجیه کنند. این زمان چندان تعجب‌آور نیست؛ اما نبود ویدئو یک‌دقیقه‌ای حاکی از آن است که پس از ۲۰ ثانیه، ممکن است حرف‌وحدیث‌های زیادی ایجاد شود؛ حرف‌وحدیث‌هایی که در‌حال‌حاضر درباره مدل‌های زبان بزرگ شناخته‌شده وجود دارد.

به‌طور‌کلی، اطلاعات مربوط به زمان‌های رندر Sora بر مرحله توسعه‌ در حال انجام این فناوری تأکید می‌کند. در‌حالی‌که قابلیت‌های ایجاد ویدئوهای تولیدشده با هوش مصنوعی مشهود است، رسیدگی به کارایی و مقیاس‌پذیری برای پذیرش گسترده‌تر همچنان حیاتی است. با ادامه‌ تکامل Sora، جالب خواهد بود که ببینیم چگونه این مسائل برطرف می‌شوند و فناوری چگونه آینده‌ ساخت ویدئو را رقم می‌زند.