شرکت نوپای Odyssey، به رهبری دو چهره سرشناس صنعت خودروهای خودران، مدل هوش مصنوعی تازهای معرفی کرده که میتواند ویدیوهایی زنده و سهبعدی تولید و پخش کند؛ ویدیوهایی که کاربران میتوانند همانند یک بازی ویدیویی در آنها تعامل داشته باشند.
به گزارش تک ناک؛ استارتآپ Odyssey، بهدست الیور کامرون و جف هاوک، از پیشگامان فناوری خودروهای خودران، تأسیس شده و اکنون با معرفی یک مدل پیشرفته هوش مصنوعی، قدمی بزرگ در جهت آیندهی رسانههای تعاملی برداشته است.
این مدل که فعلاً در قالب نسخهی نمایشی آنلاین در دسترس است، قادر است هر ۴۰ میلیثانیه یک فریم ویدیویی تازه ایجاد و پخش کند؛ فریمهایی که کاربر میتواند در فضای آنها حرکت کرده و محیط را کشف کند درست مانند یک بازی ویدیویی با گرافیک زنده و پیشبینیشده.
در وبلاگ رسمی شرکت آمده است: «بر اساس وضعیت فعلی جهان، کنشهای ورودی، و تاریخچهای از حالات و کنشها، مدل تلاش میکند وضعیت بعدی جهان را پیشبینی کند.»
این مدل، که Odyssey آن را “ویدیو تعاملی” مینامد، بر پایه یک «مدل جهان» جدید ساخته شده است؛ مدلی که تواناییهایی چون تولید پیکسلهایی با ظاهر واقعگرایانه، حفظ انسجام فضایی، یادگیری کنشها از روی ویدیو، و پخش روان و منسجم ویدیو برای بیش از ۵ دقیقه را داراست.
فهرست مطالب
از بازی تا آموزش: آیندهی رسانه در دست مدلهای جهان
علاقه به مدلهای جهان (World Models) تنها محدود به Odyssey نیست. شرکتهایی چون DeepMind، Microsoft، و استارتآپهایی همچون World Labs و Decart نیز در این مسیر گام برداشتهاند. هدف آنها استفاده از این فناوریها در تولید رسانههای تعاملی، بازیها، فیلمها، و حتی شبیهسازیهای پیچیده مانند محیطهای آموزشی برای رباتهاست.
با این حال، هنرمندان و فعالان صنایع خلاق با نگاهی متفاوت به این فناوریها مینگرند. گزارشی از Wired فاش کرده که شرکتهایی نظیر Activision Blizzard از هوش مصنوعی برای کاهش هزینهها و جبران کمبود نیرو بهره میبرند. مطالعهای که در سال ۲۰۲۴ توسط اتحادیه انیمیشن آمریکا سفارش داده شد، پیشبینی کرده که در ماههای آتی بیش از ۱۰۰ هزار شغل در حوزه فیلم، تلویزیون و انیمیشن تحتتأثیر این فناوریها قرار خواهند گرفت.
در واکنش به این نگرانیها، Odyssey اعلام کرده که قصد دارد با متخصصان خلاق همکاری کند، نه جایگزین آنها شود.
«ویدیوی تعاملی، دروازهای است به شکلهای نوین سرگرمی، جایی که داستانها میتوانند در لحظه خلق شوند و قابل کاوش باشند — بدون محدودیتهای تولید سنتی.»
نسخه نمایشی ارائهشده توسط Odyssey هنوز بینقص نیست. محیطهای تولیدشده گاه محو و ناپایدارند؛ چیدمانها ممکن است با چرخش یا حرکت ناگهانی تغییر کنند. با اینحال، این شرکت وعده داده که بهسرعت کیفیت مدل را بهبود خواهد داد. نسخه فعلی با استفاده از خوشههایی از کارتهای گرافیک Nvidia H100، ویدیو را با نرخ ۳۰ فریم در ثانیه و با هزینهای بین ۱ تا ۲ دلار بهازای هر کاربر در ساعت پخش میکند.
در توییتی، الیور کامرون نوشت:
«از یک سو آرامش، از سوی دیگر هرجومرج — و مدل هر دو را عالی بازسازی کرده است.»
برای ضبط دادههای آموزشی، تیم Odyssey بهجای تکیه بر دیتاستهای عمومی، از یک سیستم دوربین ۳۶۰ درجه نصبشده بر کولهپشتی برای ثبت مناظر واقعی استفاده کردهاند. این رویکرد به باور آنها میتواند به خلق مدلهایی باکیفیتتر منجر شود.
پشتوانه مالی و حمایتهای سرشناس
تا امروز، Odyssey موفق به جذب ۲۷ میلیون دلار سرمایه از سرمایهگذارانی چون EQT Ventures، GV و Air Street Capital شده است. اد کتمول، یکی از بنیانگذاران Pixar و رئیس پیشین والت دیزنی انیمیشن استودیوز نیز به هیئتمدیره این استارتآپ پیوسته است.
در دسامبر گذشته، Odyssey اعلام کرده بود که در حال توسعه نرمافزاری است که به خالقان محتوا اجازه میدهد صحنههای تولیدشده با مدل این شرکت را به ابزارهایی مانند Unreal Engine، Blender و Adobe After Effects وارد کرده و ویرایش دستی انجام دهند.
آیا آینده ویدیو، تعاملی خواهد بود؟
Odyssey معتقد است که دنیای ویدیو در حال پوستاندازی است.
«ما باور داریم که هر آنچه امروزه ویدیو نام دارد شامل سرگرمی، تبلیغات، آموزش، سفر، و بیشتر در آینده به شکل ویدیوهای تعاملی درخواهد آمد، و همه آنها با قدرت مدل ما.»