شرکت دیپ مایند با معرفی Genie 2، هوش مصنوعیای خلق کرده که میتواند دنیایهای تعاملی شبیه به بازیهای ویدیویی تولید کند.
به گزارش تکناک، این مدل هوش مصنوعی با آموزش دیدن بر روی صدها هزار ساعت ویدیو از بازیهای پلتفرمر دوبعدی، قادر است تصاویر ساده را به بازیهای کامل تبدیل کند.
این مدل که نسخه پیشرفته Genie است، توانایی تولید جهانهای سهبعدی قابل بازی و تعاملی با جزئیاتی بسیار غنی را داراست.
فهرست مطالب
تولید جهانهای تعاملی از تصاویر و متن
به نقل از تککرانچ، Genie 2 قادر است تنها با استفاده از یک تصویر و یک توضیح متنی کوتاه، صحنهای تعاملی و بلادرنگ ایجاد کند. بهعنوان مثال، میتواند بر اساس عبارتی مانند «یک ربات انساننمای بامزه در جنگل» صحنهای کاملاً شبیهسازی شده تولید کند.
این مدل شباهتهایی با پروژههای مشابه در حال توسعه توسط شرکت World Labs به رهبری Fei-Fei Li و استارتاپ Decart دارد، اما امکانات و قابلیتهای آن گستردهتر است.
تعامل کاربران در جهانهای تولید شده
DeepMind اعلام کرده است که Genie 2 میتواند جهانهایی با امکان انجام اقدامات تعاملی مانند پریدن و شنا کردن تولید کند. کاربران میتوانند از طریق موس و کیبورد در این جهانها به تعامل بپردازند. این مدل با استفاده از دادههای ویدیویی آموزش دیده و قادر است مواردی مانند تعاملات اشیا، انیمیشنها، نورپردازی، بازتابها و حتی رفتار شخصیتهای غیرقابل بازی (NPC) را شبیهسازی کند.
شبیهسازی در سطح بازیهای AAA
شبیهسازیهای تولید شده توسط Genie 2 شباهت زیادی به بازیهای ویدیویی AAA دارند. DeepMind بهدلیل رقابت، اطلاعات دقیقی از منابع دادههای آموزشی خود ارائه نکرده، اما گمان میرود که مدل با استفاده از ویدیوهای بازیهای معروف آموزش دیده باشد.
چالشهای حقوقی و فناوری
بحثهای زیادی درباره مالکیت فکری دادههای استفادهشده توسط Genie 2 مطرح است. گوگل بهعنوان شرکت مادر DeepMind، پیشتر اعلام کرده که شرایط استفاده از خدمات (ToS) آن اجازه استفاده از ویدیوهای YouTube برای آموزش مدلهای هوش مصنوعی را میدهد. با این حال، این سؤال مطرح است که آیا این مدل عملاً نسخههایی غیرمجاز از بازیهای ویدیویی مشاهدهشده تولید میکند؟ تصمیمگیری در این باره بر عهده محاکم قضایی است.
کاربردها و محدودیتها
Genie 2 میتواند صحنههای پایدار با دیدگاههای مختلف مانند نمای اول شخص یا ایزومتریک را برای مدت زمانی حدود یک دقیقه شبیهسازی کند. اکثر این صحنهها در بازه زمانی ۱۰ تا ۲۰ ثانیه ایجاد میشوند. با این حال، مدل بهدلیل پاک کردن پیشرفت کاربر پس از هر دوره زمانی کوتاه، برای استفاده بهعنوان یک بازی کامل مناسب نیست. DeepMind از این مدل بیشتر بهعنوان ابزاری تحقیقاتی و خلاقانه یاد میکند که میتواند در نمونهسازی تجربههای تعاملی و ارزیابی عوامل هوش مصنوعی به کار رود.
قابلیتهای منحصربهفرد Genie 2
یکی از ویژگیهای بارز Genie 2 توانایی حفظ بخشهایی از صحنههای شبیهسازیشده است که در میدان دید کاربر نیستند و بازنمایی دقیق آنها در صورت ورود مجدد به صحنه است. این قابلیت که در مدلهای مشابه مانند World Labs نیز دیده میشود، آن را از بسیاری از مدلهای دیگر متمایز میکند.
استفاده در صنعت و نگرانیهای خلاقانه
استفاده از این فناوری در صنعت بازیسازی میتواند جنبههای مختلفی داشته باشد. از یک سو، این مدل میتواند بهعنوان ابزاری برای تسریع در تولید محتوا و ارزیابی بازیها مورد استفاده قرار گیرد.
از سوی دیگر، نگرانیهایی در میان خلاقان این حوزه وجود دارد، چرا که ممکن است استفاده از این مدل به کاهش فرصتهای شغلی یا کیفیت آثار هنری بینجامد. تحقیقات Wired نشان داده است که شرکتهایی مانند Activision Blizzard برای کاهش هزینهها و افزایش بهرهوری از هوش مصنوعی استفاده میکنند.
سرمایهگذاری گوگل در مدلهای جهان
گوگل بهطور مداوم سرمایهگذاری خود در حوزه مدلهای جهان را افزایش داده است. در اکتبر گذشته، این شرکت تیم بروکس، توسعهدهنده Sora در OpenAI، و همچنین تیم راکتشل، محقق پروژههای “پایانباز” در بازیهایی مانند Nethack، را برای توسعه فناوریهای مرتبط با شبیهسازی جهان به خدمت گرفت.
Genie 2 نمونهای از آینده پژوهش و فناوری در حوزه شبیهسازی جهانهای تعاملی است و انتظار میرود تأثیرات گستردهای در صنایع خلاقانه و تحقیقاتی داشته باشد.