دیپ مایند با هوش مصنوعی Genie 2 وارد جهان‌های سه‌بعدی تعاملی می شود

شرکت دیپ مایند با معرفی Genie 2، هوش مصنوعی‌ای خلق کرده که می‌تواند دنیای‌های تعاملی شبیه به بازی‌های ویدیویی تولید کند.

به گزارش تکناک، این مدل هوش مصنوعی با آموزش دیدن بر روی صدها هزار ساعت ویدیو از بازی‌های پلتفرمر دوبعدی، قادر است تصاویر ساده را به بازی‌های کامل تبدیل کند.

این مدل که نسخه پیشرفته Genie است، توانایی تولید جهان‌های سه‌بعدی قابل بازی و تعاملی با جزئیاتی بسیار غنی را داراست.

01
از 08
تولید جهان‌های تعاملی از تصاویر و متن

به نقل از تک‌کرانچ، Genie 2 قادر است تنها با استفاده از یک تصویر و یک توضیح متنی کوتاه، صحنه‌ای تعاملی و بلادرنگ ایجاد کند. به‌عنوان مثال، می‌تواند بر اساس عبارتی مانند «یک ربات انسان‌نمای بامزه در جنگل» صحنه‌ای کاملاً شبیه‌سازی شده تولید کند.

این مدل شباهت‌هایی با پروژه‌های مشابه در حال توسعه توسط شرکت World Labs به رهبری Fei-Fei Li و استارتاپ Decart دارد، اما امکانات و قابلیت‌های آن گسترده‌تر است.

تولید جهان‌های تعاملی از تصاویر و متن در Genie 2

02
از 08
تعامل کاربران در جهان‌های تولید شده

DeepMind اعلام کرده است که Genie 2 می‌تواند جهان‌هایی با امکان انجام اقدامات تعاملی مانند پریدن و شنا کردن تولید کند. کاربران می‌توانند از طریق موس و کیبورد در این جهان‌ها به تعامل بپردازند. این مدل با استفاده از داده‌های ویدیویی آموزش دیده و قادر است مواردی مانند تعاملات اشیا، انیمیشن‌ها، نورپردازی، بازتاب‌ها و حتی رفتار شخصیت‌های غیرقابل بازی (NPC) را شبیه‌سازی کند.

03
از 08
شبیه‌سازی در سطح بازی‌های AAA

شبیه‌سازی‌های تولید شده توسط Genie 2 شباهت زیادی به بازی‌های ویدیویی AAA دارند. DeepMind به‌دلیل رقابت، اطلاعات دقیقی از منابع داده‌های آموزشی خود ارائه نکرده، اما گمان می‌رود که مدل با استفاده از ویدیوهای بازی‌های معروف آموزش دیده باشد.

شبیه‌سازی در سطح بازی‌های AAA در Genie 2

04
از 08
چالش‌های حقوقی و فناوری

بحث‌های زیادی درباره مالکیت فکری داده‌های استفاده‌شده توسط Genie 2 مطرح است. گوگل به‌عنوان شرکت مادر DeepMind، پیش‌تر اعلام کرده که شرایط استفاده از خدمات (ToS) آن اجازه استفاده از ویدیوهای YouTube برای آموزش مدل‌های هوش مصنوعی را می‌دهد. با این حال، این سؤال مطرح است که آیا این مدل عملاً نسخه‌هایی غیرمجاز از بازی‌های ویدیویی مشاهده‌شده تولید می‌کند؟ تصمیم‌گیری در این باره بر عهده محاکم قضایی است.

05
از 08
کاربردها و محدودیت‌ها

Genie 2 می‌تواند صحنه‌های پایدار با دیدگاه‌های مختلف مانند نمای اول شخص یا ایزومتریک را برای مدت زمانی حدود یک دقیقه شبیه‌سازی کند. اکثر این صحنه‌ها در بازه زمانی ۱۰ تا ۲۰ ثانیه ایجاد می‌شوند. با این حال، مدل به‌دلیل پاک کردن پیشرفت کاربر پس از هر دوره زمانی کوتاه، برای استفاده به‌عنوان یک بازی کامل مناسب نیست. DeepMind از این مدل بیشتر به‌عنوان ابزاری تحقیقاتی و خلاقانه یاد می‌کند که می‌تواند در نمونه‌سازی تجربه‌های تعاملی و ارزیابی عوامل هوش مصنوعی به کار رود.

06
از 08
قابلیت‌های منحصربه‌فرد Genie 2

یکی از ویژگی‌های بارز Genie 2 توانایی حفظ بخش‌هایی از صحنه‌های شبیه‌سازی‌شده است که در میدان دید کاربر نیستند و بازنمایی دقیق آن‌ها در صورت ورود مجدد به صحنه است. این قابلیت که در مدل‌های مشابه مانند World Labs نیز دیده می‌شود، آن را از بسیاری از مدل‌های دیگر متمایز می‌کند.

07
از 08
استفاده در صنعت و نگرانی‌های خلاقانه

استفاده از این فناوری در صنعت بازی‌سازی می‌تواند جنبه‌های مختلفی داشته باشد. از یک سو، این مدل می‌تواند به‌عنوان ابزاری برای تسریع در تولید محتوا و ارزیابی بازی‌ها مورد استفاده قرار گیرد.

از سوی دیگر، نگرانی‌هایی در میان خلاقان این حوزه وجود دارد، چرا که ممکن است استفاده از این مدل به کاهش فرصت‌های شغلی یا کیفیت آثار هنری بینجامد. تحقیقات Wired نشان داده است که شرکت‌هایی مانند Activision Blizzard برای کاهش هزینه‌ها و افزایش بهره‌وری از هوش مصنوعی استفاده می‌کنند.

08
از 08
سرمایه‌گذاری گوگل در مدل‌های جهان

گوگل به‌طور مداوم سرمایه‌گذاری خود در حوزه مدل‌های جهان را افزایش داده است. در اکتبر گذشته، این شرکت تیم بروکس، توسعه‌دهنده Sora در OpenAI، و همچنین تیم راکتشل، محقق پروژه‌های “پایان‌باز” در بازی‌هایی مانند Nethack، را برای توسعه فناوری‌های مرتبط با شبیه‌سازی جهان به خدمت گرفت.

Genie 2 نمونه‌ای از آینده پژوهش و فناوری در حوزه شبیه‌سازی جهان‌های تعاملی است و انتظار می‌رود تأثیرات گسترده‌ای در صنایع خلاقانه و تحقیقاتی داشته باشد.