شرکت OpenAI مدل هوش مصنوعی جدیدی برای ساخت ویدیو به نام Sora را معرفی کرد.
به گزارش تکناک این شرکت ادعا می کند که Sora «می تواند از طریق دستورات متنی، صحنه های واقع گرایانه و خلاقانه خلق کند».
این مدل تبدیل متن به ویدیو به کاربران امکان می دهد تا ویدیوهای فوتورئالیستی به مدت یک دقیقه بر اساس دستورات نوشته شده توسط کاربر را ایجاد کنند.
براساس پست وبلاگ OpenAI، مدل هوش مصنوعی Sora قادر است «صحنه های پیچیده با چندین کاراکتر، انواع خاصی از حرکت و جزئیات دقیق سوژه و پس زمینه» ایجاد کند.
این شرکت همچنین اشاره می کند که این مدل می تواند نحوه وجود اشیاء در دنیای فیزیکی را درک کند و همچنین «به طور دقیق لوازم جانبی را تفسیر کرده و شخصیت های جذاب با احساسات پر جنب و جوش را خلق کند».
این مدل همچنین می تواند بر اساس یک تصویر ثابت، یک ویدیو ایجاد کند و همچنین فریم های گم شده در یک ویدیوی موجود را پر کند یا آن را گسترش دهد.
دموهای ساخته شده توسط Sora در پست وبلاگ OpenAI شامل یک صحنه هوایی از کالیفرنیا در دوران هجوم کاشفان طلا، یک ویدیو که به نظر می رسد از داخل یک قطار توکیو فیلمبرداری شده است و مواردی دیگر است.
بسیاری از آنها نشانه های واضحی از هوش مصنوعی دارند . OpenAI می گوید این مدل ممکن است در “شبیه سازی دقیق فیزیک یک صحنه پیچیده دچار مشکل شود”، اما نتایج به طور کلی بسیار چشمگیر هستند.
چند سال پیش، مبدل های هوش مصنوعی تبدیل عکس به متن مانند Midjourney پیشرو در تبدیل کلمات به تصاویر بودند. اما به تازگی، ویدیو با سرعت قابل توجهی شروع به پیشرفت کرده است.
شرکتهایی مانند Runway و Pika مدل های متنی به ویدیویی چشمگیر خود را به نمایش گذاشته اند و Lumiere گوگل نیز یکی از رقبای اصلی OpenAI در این حوزه به شمار می رود. Lumiere مشابه Sora به کاربران ابزارهای متن به ویدیو می دهد و همچنین به آنها اجازه می دهد از یک تصویر ثابت ویدیو ایجاد کنند.
در حال حاضر Sora فقط برای “تیم های قرمز” شرکت OpenAI در دسترس است که این مدل را برای آسیب ها و خطرات احتمالی ارزیابی می کنند. OpenAI همچنین به برخی از هنرمندان، طراحان و فیلمسازان دسترسی به Sora را برای دریافت بازخورد می دهد.
این شرکت خاطرنشان می کند که Sora ممکن است به طور دقیق فیزیک یک صحنه پیچیده را شبیه سازی نکند و به درستی برخی موارد علت و معلولی را تفسیر نکند.
در اوایل این ماه، OpenAI اعلام کرد که به ابزار متن به تصویر خود DALL-E 3 واترمارک اضافه می کند، اما اشاره می کند که “می توان به راحتی آنها را حذف کرد”. مانند سایر محصولات هوش مصنوعی، OpenAI باید با پیامدهای ویدیوهای جعلی و فوتورئالیستی ساخته شده توسط هوش مصنوعی که با واقعیت اشتباه گرفته می شوند، مقابله کند.