با راهاندازی پروژه جنی، کاربران میتوانند به کمک هوش مصنوعی Genie 3 گوگل محیطهای تعاملی و سهبعدی را تنها با توصیف متنی خلق و در آن کاوش کنند.
به گزارش سرویس هوش مصنوعی تکناک، گوگل پروژه جنی (Project Genie) را راهاندازی کرد که در آن مدل پیشرفته هوش مصنوعی جنی ۳ (Genie 3) را در دسترس مشترکان سرویس Google AI Ultra در ایالات متحده قرار میدهد. این مدل بهعنوان مدل جهانی همهمنظوره توصیف شده است که محیطهای متنوع و تعاملی را میتواند تولید کند که گام مهمی در مسیر گوگل دیپمایند برای دستیابی به هوش مصنوعی عمومی (AGI) محسوب میشود.
برخلاف مدلهای قبلی گوگل دیپمایند که برای محیطهای خاص مانند شطرنج یا گو طراحی شده بودند، Genie 3 مدل جهانی است که ازپس شبیهسازی پویای محیط و پیشبینی نحوه تکامل آن و تأثیر اقدامات کاربر بر آن برمیآید. این قابلیت برای ساخت AGI حیاتی است که نیازمند سیستمهایی است تا بتوانند در تنوع دنیای واقعی حرکت کنند.
این نمونه اولیه تحقیقاتی و آزمایشی به کاربران امکان میدهد تا محیط خود را توصیف کنند؛ ازجمله جزئیاتی مانند نحوه گشتوگذار در آن (پیادهروی، سواری، پرواز، رانندگی و…) و انتخاب دید اول شخص یا سوم شخص. پساز آن، کاربران شخصیت خود را تعریف میکنند، خواه فرد، حیوان، شیء یا هر چیز دیگر.
سپس با استفاده از Nano Banana Pro، پروژه جنی تصویر پیشنمایش یا طرحریزی جهان (World Sketching) خلق میکند. این قابلیت به کاربران اجازه میدهد تا ظاهر دنیای خود را پیشاز ورود مشاهده کنند و تصویر را برای تنظیم دقیقتر جهان خود تغییر دهند.
پساز ایجاد جهان، کاربران به جلسات ۶۰ ثانیهای محدود میشوند. جهانهای تولیدشده وضوح 720p دارند و نرخ تعامل ۲۰ تا ۲۴ فریمبرثانیه را ارائه میدهند. هنگام حرکت در جهان، هوش مصنوعی Genie 3 گوگل مسیر پیش رو را بهصورت آنی و براساس اقداماتی تولید میکند که انجام میدهید. گوگل بر شبیهسازی فیزیک و تعاملات با ثبات بیسابقه تأکید میکند. کاربران میتوانند دوربین را هنگام تعامل با جهان تنظیم و ویدئوهای گشتوگذار خود را دانلود کنند.

ویژگی دیگر ترکیب مجدد جهانها (Remix Worlds) است که به کاربران امکان میدهد تا جهانهای موجود را با تکیه بر پرامپتهایشان، به تفسیرهای جدیدی بازسازی کنند. همچنین، جهانهای منتخب را در گالری یا با استفاده از آیکون تصادفیساز برای الهامگرفتن و ساختوساز میتوانند بیشتر کاوش کنند. گوگل درحال کار روی بهبود پروژه جنی با افزودن رویدادهای فرمانپذیری است که با کاوش کاربران، جهان را تغییر میدهند.
این نسخه نمایشی به گوگل اجازه میدهد تا درک بهتری از چگونگی استفاده مردم از مدلهای جهانی در بسیاری از زمینههای تحقیقات هوش مصنوعی و رسانههای مولد پیدا کند. دسترسی به این قابلیت از امروز برای مشترکان بزرگتر از ۱۸ سال اشتراک Google AI Ultra در ایالات متحده آغاز میشود و بهمرور به مناطق بیشتری گسترش خواهد یافت.
9to5google مینویسد که هدف گوگل در دسترس قرار دادن این تجربیات و فناوری برای کاربران بیشتر است. مدلهای جهانی بخشی جداییناپذیر از مأموریت AGI گوگل دیپمایند هستند و شبیهسازی سناریوهای دنیای واقعی کاربردهای عملی گستردهای از رباتیک و مدلسازی انیمیشن و داستاننویسی، تا کاوش مکانها و تنظیمات تاریخی دارند.

















