گوگل نسخه پیشنمایش Gemini 2.5 Flash را منتشر کرده است که اولین مدل Reasoning کاملاً ترکیبی این شرکت به شمار میآید.
به گزارش تکناک، گوگل در ادامه روند توسعه مدلهای زبانی پیشرفته خود، از نسخه پیشنمایش مدل Gemini 2.5 Flash در رویداد Cloud Next پردهبرداری کرد؛ مدلی که بهعنوان اولین مدل کاملاً هیبریدی گوگل برای پردازش منطقی شناخته میشود. این مدل هماکنون ازطریق Gemini API در Google AI Studio ،Vertex AI، اپلیکیشن جمنای و ابزار Canvas برای استفاده عمومی در دسترس است. کاربران میتوانند از آن برای ویرایش کد و تنظیم سند و اجرای انواع تسکهای پیچیده استفاده کنند.
فهرست مطالب
گامی فراتر از Flash 2.0
مدل Gemini 2.5 Flash در ادامه نسخه قبلی خود، یعنی Gemini 2.0 Flash، طراحی شده است؛ اما این بار نهفقط با سرعت زیاد، بلکه با قابلیتهای استدلالی بسیار پیشرفتهتر منتشر شده است. این مدل بهگونهای ساخته شده است که توسعهدهندگان بتوانند بسته به نیاز خود، ویژگی Reasoning یا «پردازش منطقی» را فعال یا غیرفعال کنند. این ویژگی به آنها اجازه میدهد تا میان کیفیت و هزینه و زمان پاسخدهی توازن ایجاد کنند.
به نقل از نئووین، برخلاف بسیاری از مدلهای هوش مصنوعی که پردازش منطقی همواره در آنها فعال است، در 2.5 Flash میتوان این قابلیت را برای تسکهای ساده مانند ترجمه یا بازنویسی خاموش کرد تا هزینه و تأخیر کاهش یابد. بهعنوان نمونه، ترجمه عبارتی ساده مانند «Thank You» در زبان هندی به استدلال نیاز ندارد؛ اما حل معادله ریاضی پیچیده یا طراحی جدول برنامهریزی روزانه، نیازمند درگیری پردازش منطقی مدل است.
ساختار قیمتگذاری انعطافپذیر
مدل جدید ساختار قیمتی جذابی دارد که امکان استفاده گسترده از آن را فراهم میسازد:
- ۰٫۱۵ دلار برای هر یکمیلیون توکن ورودی
- ۰٫۶۰ دلار برای هر یکمیلیون توکن خروجی بدون استدلال
- ۳٫۵۰ دلار برای هر یکمیلیون توکن خروجی با استدلال
این قیمتها نشان میدهد که گوگل قصد دارد مدلهای هوش مصنوعی را برای کاربردهای روزمره و حتی غیرتجاری نیز مقرونبهصرفهتر کند.
بهبودهای عملکردی و نتایج بنچمارک
Gemini 2.5 Flash در مقایسه با نسخه قبلی خود، در آزمون مشهور Humanity’s Last Exam امتیاز ۱۲٫۱ درصد را بهدست آورده است که از امتیاز ۵٫۱ درصدی Flash 2.0 بیش از دو برابر بهبود عملکرد را نشان میدهد. این نتیجه آن را بالاتر از مدلهایی مانند Claude 3.7 Sonnet و DeepSeek R1 قرار داده است؛ هرچند هنوز در رتبهای پایینتر از مدل جدید o4-mini شرکت OpenAI قرار دارد.

همچنین، این مدل در رتبهبندی LMArena leaderboard، عملکردی نزدیک به مدل پرو دارد و بهویژه در تسکهایی مانند حل مسائل چندمرحلهای ریاضی، کدنویسی پیشرفته در پایتون، ساخت بازیهای ساده و حتی تولید اسناد ساختاریافته عملکرد مطلوبی دارد.
تفاوت با مدلهای رقیب
مدلهای o3 و o4-mini از OpenAI تنها یک روز پیشاز رونمایی Gemini 2.5 Flash منتشر شدند و رقابت شدیدی میان آنها برای تصاحب رتبههای نخست در پلتفرمهای مقایسهای در جریان است. با اینکه مدل Flash جدید هنوز ابزارهایی مانند وبگردی زنده یا تحلیل فایلها را ندارد، با هزینه اندک و انعطافپذیری زیاد گزینهای بسیار کاربردی برای توسعهدهندگان محسوب میشود.
امکانات گسترده
مدل Gemini 2.5 Flash از ویژگیهای زیر برخوردار است:
- پنجره متنی تا یکمیلیون توکن
- پشتیبانی از انواع ورودیها: متنی، صوتی، تصویری و ویدئویی
- توانایی تنظیم خودکار سطح استدلال با توجه به پیچیدگی درخواست
- دانش بهروز تا ژانویه ۲۰۲۵
در نهایت، عرضه این مدل را میتوان حرکتی راهبردی گوگل برای رقابت با مدلهای پیشرفته شرکتهای رقیب دانست؛ بهویژه با درنظرگرفتن افزایش شدید هزینه مدلهای هوش مصنوعی در بازار جهانی. Gemini 2.5 Flash ترکیبی از عملکرد و انعطافپذیری مناسب و هزینه کم است که میتواند برای کاربران حرفهای و سازمانی انتخابی هوشمندانه باشد.