شرکت xAI از اضافه شدن قابلیت Grok Vision به چتبات Grok خبر داده است که به آن امکان میدهد تصاویر را از طریق دوربین گوشی شناسایی و تحلیل کند.
به گزارش تکناک، قابلیت Grok Vision به کاربران اجازه میدهد دوربین گوشی خود را به سمت اشیایی مانند: محصولات، تابلوها و اسناد بگیرند و سوالاتی درباره محتوای تصویری مطرح کنند. این قابلیت در حال حاضر فقط از طریق اپلیکیشن iOS در دسترس است و هنوز نسخه اندروید از آن پشتیبانی نمیکند.
ویژگی Grok Vision شباهت زیادی به امکانات دیداری بلادرنگ در مدلهای Gemini گوگل و ChatGPT دارد و نشاندهنده رقابت فزاینده در زمینه هوش مصنوعی مولد با قابلیت درک بصری است. کاربران میتوانند از این ابزار برای تحلیل محتوای محیطی و دریافت پاسخهای فوری بهره ببرند، که گامی مهم به سوی ادغام هوش مصنوعی با زندگی روزمره است.
علاوه بر Grok Vision، قابلیتهای جدیدی نیز برای چتبات Grok عرضه شدهاند، که شامل پشتیبانی صوتی چندزبانه و جستوجوی آنی در حالت صوتی است. البته این ویژگیها تنها برای کاربران نسخه اندروید در صورت اشتراک ماهانه ۳۰ دلاری SuperGrok فعال میشود.
شرکت xAI طی ماههای گذشته به طور مستمر قابلیتهای Grok را گسترش داده است. در اوایل ماه جاری، امکان استفاده از حافظه برای بازیابی جزئیات مکالمات گذشته به این چتبات اضافه شد. همچنین ابزاری شبیه بوم دیجیتال برای ایجاد اسناد و اپلیکیشنها به آن اضافه شده است، که امکان ساخت محتوا را برای کاربران تسهیل میکند.
چتبات Grok با قابلیت Grok Vision، نهتنها شنونده و پاسخگو است، بلکه بینندهای تحلیلگر نیز میباشد، که میتواند به شکل بلادرنگ از محیط واقعی اطلاعات دریافت کند؛ مسیری که میتواند آینده استفاده از هوش مصنوعی را در زندگی روزمره دگرگون نماید.