خلق جهان‌های مجازی با هوش مصنوعی Genie 3 گوگل شروع شد

با راه‌اندازی پروژه جنی، کاربران می‌توانند به کمک هوش مصنوعی Genie 3 گوگل محیط‌های تعاملی و سه‌بعدی را تنها با توصیف متنی خلق و در آن کاوش کنند.

به گزارش سرویس هوش مصنوعی تک‌ناک، گوگل پروژه جنی (Project Genie) را راه‌اندازی کرد که در آن مدل پیشرفته هوش مصنوعی جنی ۳ (Genie 3) را در دسترس مشترکان سرویس Google AI Ultra در ایالات متحده قرار می‌دهد. این مدل به‌عنوان مدل جهانی همه‌منظوره توصیف شده است که محیط‌های متنوع و تعاملی را می‌تواند تولید کند که گام مهمی در مسیر گوگل دیپ‌مایند برای دستیابی به هوش مصنوعی عمومی (AGI) محسوب می‌شود.

برخلاف مدل‌های قبلی گوگل دیپ‌مایند که برای محیط‌های خاص مانند شطرنج یا گو طراحی شده بودند، Genie 3 مدل جهانی است که ازپس شبیه‌سازی پویای محیط و پیش‌بینی نحوه تکامل آن و تأثیر اقدامات کاربر بر آن برمی‌آید. این قابلیت برای ساخت AGI حیاتی است که نیازمند سیستم‌هایی است تا بتوانند در تنوع دنیای واقعی حرکت کنند.

این نمونه اولیه تحقیقاتی و آزمایشی به کاربران امکان می‌دهد تا محیط خود را توصیف کنند؛ ازجمله جزئیاتی مانند نحوه گشت‌وگذار در آن (پیاده‌روی، سواری، پرواز، رانندگی و…) و انتخاب دید اول شخص یا سوم شخص. پس‌از آن، کاربران شخصیت خود را تعریف می‌کنند، خواه فرد، حیوان، شیء یا هر چیز دیگر.

سپس با استفاده از Nano Banana Pro، پروژه جنی تصویر پیش‌نمایش یا طرح‌ریزی جهان (World Sketching) خلق می‌کند. این قابلیت به کاربران اجازه می‌دهد تا ظاهر دنیای خود را پیش‌از ورود مشاهده کنند و تصویر را برای تنظیم دقیق‌تر جهان خود تغییر دهند.

پس‌از ایجاد جهان، کاربران به جلسات ۶۰ ثانیه‌ای محدود می‌شوند. جهان‌های تولید‌شده وضوح 720p دارند و نرخ تعامل ۲۰ تا ۲۴ فریم‌برثانیه را ارائه می‌دهند. هنگام حرکت در جهان، هوش مصنوعی Genie 3 گوگل مسیر پیش رو را به‌صورت آنی و بر‌اساس اقداماتی تولید می‌کند که انجام می‌دهید. گوگل بر شبیه‌سازی فیزیک و تعاملات با ثبات بی‌سابقه تأکید می‌کند. کاربران می‌توانند دوربین را هنگام تعامل با جهان تنظیم و ویدئوهای گشت‌وگذار خود را دانلود کنند.

رابط کاربری پروژه Genie که یک شخصیت کارتونی را در حال ورود به یک دنیای فانتزی داخل حباب نشان می‌دهد.

ویژگی دیگر ترکیب مجدد جهان‌ها (Remix Worlds) است که به کاربران امکان می‌دهد تا جهان‌های موجود را با تکیه بر پرامپت‌هایشان، به تفسیرهای جدیدی بازسازی کنند. همچنین، جهان‌های منتخب را در گالری یا با استفاده از آیکون تصادفی‌ساز برای الهام‌گرفتن و ساخت‌وساز می‌توانند بیشتر کاوش کنند. گوگل درحال کار روی بهبود پروژه جنی با افزودن رویدادهای فرمان‌پذیری است که با کاوش کاربران، جهان را تغییر می‌دهند.

این نسخه نمایشی به گوگل اجازه می‌دهد تا درک بهتری از چگونگی استفاده مردم از مدل‌های جهانی در بسیاری از زمینه‌های تحقیقات هوش مصنوعی و رسانه‌های مولد پیدا کند. دسترسی به این قابلیت از امروز برای مشترکان بزرگ‌تر از ۱۸ سال اشتراک Google AI Ultra در ایالات متحده آغاز می‌شود و به‌مرور به مناطق بیشتری گسترش خواهد یافت.

9to5google می‌نویسد که هدف گوگل در دسترس قرار دادن این تجربیات و فناوری برای کاربران بیشتر است. مدل‌های جهانی بخشی جدایی‌ناپذیر از مأموریت AGI گوگل دیپ‌مایند هستند و شبیه‌سازی سناریوهای دنیای واقعی کاربردهای عملی گسترده‌ای از رباتیک و مدل‌سازی انیمیشن و داستان‌نویسی، تا کاوش مکان‌ها و تنظیمات تاریخی دارند.