گوگل از نسل جدید مدل‌های استدلالی هوش مصنوعی رونمایی کرد

شرکت گوگل روز سه‌شنبه از نسل جدید مدل‌های استدلالی هوش مصنوعی با نام Gemini 2.5 رونمایی کرد.

به گزارش تک‌ناک، این مدل‌ها با بهبود توانایی تحلیل، استنتاج و تصمیم‌گیری در سناریوهای پیچیده، دقت و کارایی سیستم‌های مبتنی بر هوش مصنوعی را افزایش می‌دهند و در کاربردهایی مانند: پردازش زبان طبیعی و حل مسائل چندمرحله‌ای مورد استفاده قرار می‌گیرند.

مدل‌های استدلالی هوش مصنوعی Gemini 2.5، مجموعه‌ پیشرفته‌ای است که قبل از پاسخ دادن به پرسش‌ها، مکث و به‌ اصطلاح «فکر می‌کند». این اقدام، گام تازه‌ای از سوی گوگل برای تقویت قابلیت استدلال در سیستم‌های هوش مصنوعی به حساب می‌آید.

نخستین مدل این خانواده با عنوان Gemini 2.5 Pro Experimental عرضه شده، که به‌ گفته گوگل، پیشرفته‌ترین و هوشمندترین مدل این شرکت تا امروز است. این مدل چندوجهی و مبتنی بر استدلال، از روز سه‌شنبه در پلتفرم Google AI Studio برای توسعه‌دهندگان و در اپلیکیشن Gemini برای مشترکان نسخه پولی Gemini Advanced با هزینه ماهانه ۲۰ دلار در دسترس قرار گرفته است.

شرکت گوگل اعلام کرده است که از این پس، همه مدل‌های جدید هوش مصنوعی این شرکت به‌ صورت پیش‌فرض از قابلیت‌های استدلال بهره‌مند خواهند بود. این تصمیم در حالی اتخاذ می‌شود که رقابت شرکت‌های فناوری برای توسعه مدل‌های هوش مصنوعی استدلال‌محور شدت گرفته است. پس از معرفی مدل o1 توسط OpenAI در سپتامبر ۲۰۲۴، شرکت‌هایی مانند: Anthropic، DeepSeek، xAI و گوگل تلاش کرده‌اند با صرف منابع پردازشی بیشتر، مدل‌هایی تولید کنند که توانایی تحلیل، بررسی صحت اطلاعات و ارائه پاسخ‌های دقیق‌تری داشته باشند.

به نقل از تک‌کرانچ، گوگل پیش‌تر نیز نسخه‌ای از Gemini با توانایی «تفکر» را در دسامبر ۲۰۲۴ معرفی کرده بود، اما Gemini 2.5 جدی‌ترین تلاش این شرکت برای رقابت با سری مدل‌های o شرکت OpenAI محسوب می‌شود. گوگل مدعی است که Gemini 2.5 Pro عملکرد بهتری نسبت به مدل‌های پیشین این شرکت و حتی برخی از مدل‌های رقیب دارد. به‌ویژه، این مدل برای ساخت اپلیکیشن‌های وب بصری و سیستم‌های کدنویسی خودکار بهینه‌سازی شده است.

گوگل از نسل جدید مدل‌های استدلالی هوش مصنوعی با نام Gemini 2.5 رونمایی کرد

در بنچمارک Aider Polyglot که توانایی مدل‌ها در ویرایش کد را می‌سنجد، Gemini 2.5 Pro موفق به کسب امتیاز ۶۸.۶ درصد شده و از مدل‌های برتر شرکت‌های OpenAI، Anthropic و DeepSeek پیشی گرفته است. با وجود این، در ارزیابی SWE-bench Verified که مهارت‌های توسعه نرم‌افزار را بررسی می‌کند، این مدل با امتیاز ۶۳.۸ درصد عملکرد پایین‌تری از Claude 3.7 Sonnet شرکت Anthropic با امتیاز ۷۰.۳ درصد داشته، اما همچنان از مدل‌های OpenAI و DeepSeek بهتر عمل کرده است.

یکی از مهم‌ترین دستاوردهای این مدل، کسب امتیاز ۱۸.۸ درصد در آزمون Humanity’s Last Exam بوده، که آزمونی چندوجهی متشکل از هزاران پرسش جمع‌سپاری‌شده در حوزه‌های ریاضیات، علوم انسانی و علوم طبیعی است. این امتیاز، عملکرد بهتر Gemini 2.5 Pro نسبت به اکثر مدل‌های پرچم‌دار رقیب را نشان می‌دهد.

همچنین گوگل اعلام کرده است که این مدل با پنجره متنی یک میلیون توکنی عرضه می‌شود؛ به این معنا که می‌تواند حدود ۷۵۰ هزار واژه را به‌ صورت هم‌زمان پردازش کند، که از کل مجموعه کتاب‌های «ارباب حلقه‌ها» نیز فراتر می‌رود. به‌ زودی این ظرفیت به دو میلیون توکن نیز افزایش خواهد یافت.

در حالی که جزئیات قیمت API این مدل هنوز اعلام نشده، اما گوگل وعده داده است که طی هفته‌های آینده اطلاعات بیشتری را در این زمینه منتشر خواهد کرد. این رونمایی، گام مهمی در مسیر توسعه مدل‌های هوش مصنوعی مبتنی بر استدلال و حرکت به‌سوی عامل‌های خودمختار است، که می‌توانند بدون نیاز به دخالت انسانی، وظایف پیچیده را انجام دهند.