مدل هوش مصنوعی Genie 3 گوگل مرزهای واقعیت مجازی را جابهجا و فقط با یک دستور متنی، دنیاهای سهبعدی زنده و تعاملپذیر خلق میکند.
به گزارش تکناک، دیپمایند گوگل بهتازگی نسخه سوم مدل هوش مصنوعی خود با عنوان Genie 3 را رونمایی کرده است. این مدل بخشی از پروژههای آیندهنگرانه گوگل درزمینه World Models یا «مدلهای دنیامحور» است؛ فناوریهایی که میتوانند فضاهای شبیه به بازیهای ویدئویی را تنها با یک دستور متنی (Prompt) تولید کنند. با معرفی Genie 3، گوگل قدمی بزرگ در توسعه هوشهای مصنوعی مولد برداشته است که تعامل واقعیتر با دنیای مجازی را امکانپذیر میسازد.
ورج مینویسد که یکی از پیشرفتهای بزرگ مدل هوش مصنوعی Genie 3 گوگل در مقایسه با نسخه قبلی، افزایش زمان تعامل پیوسته است. درحالیکه Genie 2 تنها میتوانست ۱۰ تا ۲۰ ثانیه محیط قابل بازی ایجاد کند، نسخه جدید چند دقیقه تعامل زنده را فراهم میکند. افزونبر این، Genie 3 نوعی حافظه بصری موقت دارد؛ بدینمعنا که اگر کاربر از شیئی چشم بردارد و دوباره به آن نگاه کند، شیء در مکان اولیه خود باقی خواهد ماند. این «حافظه فضایی» تا حدود یک دقیقه فعال باقی میماند.

ازنظر فنی، دنیاهای تولیدشده با مدل هوش مصنوعی Genie 3 گوگل با وضوح 720p و نرخ ۲۴ فریمبرثانیه اجرا میشوند؛ عددی که برای تجربهای روان و واقعگرایانه در دنیای مجازی کافی به نظر میرسد. در نسخه سوم، ویژگی جدیدی با عنوان Promptable World Events نیز افزوده شده است. کاربران میتوانند با واردکردن اعلانهایی ساده، تغییراتی مانند بارش باران و اضافهکردن شخصیت جدید یا تغییر روشنایی محیط را در لحظه اعمال کنند. این قابلیت میتواند کاربردهای متنوعی در حوزههای بازیسازی، آموزش، شبیهسازی و خلاقیت دیجیتال داشته باشد.
اگرچه Genie 3 ازنظر فنی پیشرفتی چشمگیر محسوب میشود، هنوز بهصورت عمومی در دسترس قرار نگرفته است. طبق اعلام گوگل، درحالحاضر این مدل، تنها در قالب پیشنمایش تحقیقاتی محدود در اختیار گروه کوچکی از پژوهشگران و تولیدکنندگان محتوا قرار میگیرد تا خطاهای احتمالی آن بررسی و کنترل شود. همچنین، برخی محدودیتها در نسخه فعلی همچنان پابرجاست. برای نمونه، ایجاد متنهای خوانا روی تابلوها یا دیوارها فقط درصورتی ممکن است که از ابتدا در توصیف محیط وجود داشته باشند.
مدل هوش مصنوعی Genie 3 گوگل نهتنها قدرت هوش مصنوعی در خلق محیطهای زنده و پویا را نشان میدهد؛ بلکه گامی استراتژیک برای اهالی مانتینویو در رقابت با پروژههایی مانند سورا (Sora) از OpenAI محسوب میشود. با پیشرفت تدریجی در حافظه محیطی و تعاملپذیری و گرافیک، مدلهای دنیامحور میتوانند آینده بازیسازی و آموزش مجازی و حتی تعامل با رباتها را متحول کنند.