شرکت تحقیقاتی هوش مصنوعی xAI،، مدل جدیدی به نام Grok-1.5V را منتشر کرده که هدف آن رقابت با مدل زبانی قدرتمند GPT-4 از شرکت OpenAI است.
بهگزارش تکناک، شرکت xAI مدل هوش مصنوعی چندوجهی جدید خود، یعنی Grok-1.5V را رونمایی کرد که گام مهمی در توسعه سیستمهای حقیقتاً هوشمند بهشمار میرود. این شرکت ادعا میکند که Grok-1.5V فراتر از درک متن عمل میکند و با ادغام قابلیتهای بینایی، توانایی درک اسناد، نمودارها، جداول، تصاویر و… را دارد.
نئووین بهنقل از xAI گزارش میدهد که مدل Grok-1.5V درمقایسهبا رقبای پیشرو در معیارهای اصلی عملکرد بهتری دارد. این مدل در مجموعه دادههای RealWorldQA متعلق به xAI که شامل ارزیابی بیش از ۷۰۰ تصویر دنیای واقعی بههمراه سؤالات مرتبط با آنها است، خوش درخشید. این مجموعه داده توانایی هوش مصنوعی را در درک سناریوهای بصری پیچیده ارزیابی میکند و پیشرفت بهسمت هوش عمومی را میسنجد.
درک چندوجهی Grok-1.5V و قابلیتهای آن
قابلیت درک چندوجهی Grok-1.5V ازطریق مثالهایی بهنمایش گذاشته شده است؛ مانند تبدیل نقاشی کودک به داستان قبل از خواب. این مدل میتواند جداول را به فرمت CSV تبدیل کند. xAI معتقد است که چنین وظایف متنوعی، قابلیتهای Grok-1.5V را برای طیف وسیعی از کاربردها نشان میدهد.
ایلان ماسک شرکت xAI را در جولای ۲۰۲۳ راهاندازی کرد. ماسک هدف از تأسیس این شرکت را توسعه هوش مصنوعی شفافتر و پاسخگوتر عنوان کرد که بتواند بهتر با انسانها کار کند. یکی از مسائل مهمی که اکنون درباره هوش مصنوعی وجود دارد، جدیتی است که همه با آن برخورد میکنند.
برخی میگویند هوش مصنوعی به ازبینرفتن مشاغل منجر میشود و برخی دیگر از تواناییهای هنری آن متنفرند و ادعا میکنند که واقعاً هنر نیست و برخی دیگر از این موضوع شکایت میکنند که دانشآموزان نباید برای انجام تکالیفشان از آن استفاده کنند. xAI انتظار دارد در ماههای آینده تحقیقاتش را روی چندین حوزه اساسی متمرکز کند. این شرکت بهدنبال بهبود تجسم و توضیح استدلال چندوجهی Grok است.
xAI بهزودی بهدنبال اولین آزمایشکنندگان Grok-1.5V خواهد بود تا بازخورد ارائه دهند و به بهبود استدلال چندوجهی آن کمک کنند. دسترسی به نسخه آزمایشی Grok در ابتدا به مشترکان سرویس پریمیوم پلاس X محدود است که مزایا و پشتیبانیهای بیشتری دریافت میکنند.