مدل هوش مصنوعی Sora که بهتازگی OpenAI رونمایی کرده، ویدئوهای واقعگرایانه را از روی متن میتواند تولید کند. بااینحال، مباحثات نشان میدهد که ساخت یک دقیقه ویدیو با این مدل بیش از یک ساعت طول میکشد.
بهگزارش تکناک، درحالیکه زمان دقیق رندر ویدئوهای تولیدی Sora مشخص نیست، در پستی در Reddit توضیح داده شده است که زمان رندر از روشهای سنتی ساخت ویدئو بسیار بیشتر است.
باید بدانید این بحثها براساس اطلاعات محدودی درگرفته است و محققان عمدتاً نمونههای پیشساخته را بهنمایش میگذارند و اجازه دسترسی عموم به دستورهای سفارشی را نمیدهند. طولانیترین ویدئو نمایشدادهشده، تنها 17 ثانیه طول داشت.
دیدگاههای مختلفی درباره این زمانهای رندر بهوجود آمده است. برخی از کاربران به غیرعملیبودن زمانهای رندر طولانی، بهویژه هنگام تکرار چندین دستور، اشاره کردند. عدهای دیگر درباره دلایل احتمالی پشت زمانهای رندر طولانی گمانهزنی کردهاند. یکی از کاربران با استناد به اظهارات سم آلتمن، مدیرعامل OpenAI، به نیاز به بودجه هنگفت اشاره کرد: «میتوانم بفهمم که چرا او (سم آلتمن) اکنون 7 تریلیون دلار میخواهد.»
همچنین مقایسههایی با مدل هوش مصنوعی دیگری که بهتازگی معرفی شده است، یعنی Gemini 1.5 گوگل، انجام شده است که بر فضای رقابتی تأکید میکند. درنهایت، برخی از کاربران سعی کردند زمانهای رندر را با مقایسه آنها با انیمیشنهای سنتی توجیه کنند. این زمان چندان تعجبآور نیست؛ اما نبود ویدئو یکدقیقهای حاکی از آن است که پس از ۲۰ ثانیه، ممکن است حرفوحدیثهای زیادی ایجاد شود؛ حرفوحدیثهایی که درحالحاضر درباره مدلهای زبان بزرگ شناختهشده وجود دارد.
بهطورکلی، اطلاعات مربوط به زمانهای رندر Sora بر مرحله توسعه در حال انجام این فناوری تأکید میکند. درحالیکه قابلیتهای ایجاد ویدئوهای تولیدشده با هوش مصنوعی مشهود است، رسیدگی به کارایی و مقیاسپذیری برای پذیرش گستردهتر همچنان حیاتی است. با ادامه تکامل Sora، جالب خواهد بود که ببینیم چگونه این مسائل برطرف میشوند و فناوری چگونه آینده ساخت ویدئو را رقم میزند.