شرکت گوگل روز سهشنبه از نسل جدید مدلهای استدلالی هوش مصنوعی با نام Gemini 2.5 رونمایی کرد.
به گزارش تکناک، این مدلها با بهبود توانایی تحلیل، استنتاج و تصمیمگیری در سناریوهای پیچیده، دقت و کارایی سیستمهای مبتنی بر هوش مصنوعی را افزایش میدهند و در کاربردهایی مانند: پردازش زبان طبیعی و حل مسائل چندمرحلهای مورد استفاده قرار میگیرند.
مدلهای استدلالی هوش مصنوعی Gemini 2.5، مجموعه پیشرفتهای است که قبل از پاسخ دادن به پرسشها، مکث و به اصطلاح «فکر میکند». این اقدام، گام تازهای از سوی گوگل برای تقویت قابلیت استدلال در سیستمهای هوش مصنوعی به حساب میآید.
نخستین مدل این خانواده با عنوان Gemini 2.5 Pro Experimental عرضه شده، که به گفته گوگل، پیشرفتهترین و هوشمندترین مدل این شرکت تا امروز است. این مدل چندوجهی و مبتنی بر استدلال، از روز سهشنبه در پلتفرم Google AI Studio برای توسعهدهندگان و در اپلیکیشن Gemini برای مشترکان نسخه پولی Gemini Advanced با هزینه ماهانه ۲۰ دلار در دسترس قرار گرفته است.
شرکت گوگل اعلام کرده است که از این پس، همه مدلهای جدید هوش مصنوعی این شرکت به صورت پیشفرض از قابلیتهای استدلال بهرهمند خواهند بود. این تصمیم در حالی اتخاذ میشود که رقابت شرکتهای فناوری برای توسعه مدلهای هوش مصنوعی استدلالمحور شدت گرفته است. پس از معرفی مدل o1 توسط OpenAI در سپتامبر ۲۰۲۴، شرکتهایی مانند: Anthropic، DeepSeek، xAI و گوگل تلاش کردهاند با صرف منابع پردازشی بیشتر، مدلهایی تولید کنند که توانایی تحلیل، بررسی صحت اطلاعات و ارائه پاسخهای دقیقتری داشته باشند.
به نقل از تککرانچ، گوگل پیشتر نیز نسخهای از Gemini با توانایی «تفکر» را در دسامبر ۲۰۲۴ معرفی کرده بود، اما Gemini 2.5 جدیترین تلاش این شرکت برای رقابت با سری مدلهای o شرکت OpenAI محسوب میشود. گوگل مدعی است که Gemini 2.5 Pro عملکرد بهتری نسبت به مدلهای پیشین این شرکت و حتی برخی از مدلهای رقیب دارد. بهویژه، این مدل برای ساخت اپلیکیشنهای وب بصری و سیستمهای کدنویسی خودکار بهینهسازی شده است.

در بنچمارک Aider Polyglot که توانایی مدلها در ویرایش کد را میسنجد، Gemini 2.5 Pro موفق به کسب امتیاز ۶۸.۶ درصد شده و از مدلهای برتر شرکتهای OpenAI، Anthropic و DeepSeek پیشی گرفته است. با وجود این، در ارزیابی SWE-bench Verified که مهارتهای توسعه نرمافزار را بررسی میکند، این مدل با امتیاز ۶۳.۸ درصد عملکرد پایینتری از Claude 3.7 Sonnet شرکت Anthropic با امتیاز ۷۰.۳ درصد داشته، اما همچنان از مدلهای OpenAI و DeepSeek بهتر عمل کرده است.
یکی از مهمترین دستاوردهای این مدل، کسب امتیاز ۱۸.۸ درصد در آزمون Humanity’s Last Exam بوده، که آزمونی چندوجهی متشکل از هزاران پرسش جمعسپاریشده در حوزههای ریاضیات، علوم انسانی و علوم طبیعی است. این امتیاز، عملکرد بهتر Gemini 2.5 Pro نسبت به اکثر مدلهای پرچمدار رقیب را نشان میدهد.
همچنین گوگل اعلام کرده است که این مدل با پنجره متنی یک میلیون توکنی عرضه میشود؛ به این معنا که میتواند حدود ۷۵۰ هزار واژه را به صورت همزمان پردازش کند، که از کل مجموعه کتابهای «ارباب حلقهها» نیز فراتر میرود. به زودی این ظرفیت به دو میلیون توکن نیز افزایش خواهد یافت.
در حالی که جزئیات قیمت API این مدل هنوز اعلام نشده، اما گوگل وعده داده است که طی هفتههای آینده اطلاعات بیشتری را در این زمینه منتشر خواهد کرد. این رونمایی، گام مهمی در مسیر توسعه مدلهای هوش مصنوعی مبتنی بر استدلال و حرکت بهسوی عاملهای خودمختار است، که میتوانند بدون نیاز به دخالت انسانی، وظایف پیچیده را انجام دهند.