گوگل نسخه پیش‌نمایش مدل Gemini 2.5 Flash را منتشر کرد

گوگل نسخه پیش‌نمایش Gemini 2.5 Flash را منتشر کرده است که اولین مدل Reasoning کاملاً ترکیبی این شرکت به شمار می‌آید.

به گزارش تک‌ناک، گوگل در ادامه روند توسعه مدل‌های زبانی پیشرفته خود، از نسخه پیش‌نمایش مدل Gemini 2.5 Flash در رویداد Cloud Next پرده‌برداری کرد؛ مدلی که به‌عنوان اولین مدل کاملاً هیبریدی گوگل برای پردازش منطقی شناخته می‌شود. این مدل هم‌اکنون ازطریق Gemini API در Google AI Studio ،‌Vertex AI‌، اپلیکیشن جمنای و ابزار Canvas برای استفاده عمومی در دسترس است. کاربران می‌توانند از آن برای ویرایش کد و تنظیم سند و اجرای انواع تسک‌های پیچیده استفاده کنند.

01
از 05
گامی فراتر از Flash 2.0

مدل Gemini 2.5 Flash در ادامه نسخه قبلی خود، یعنی Gemini 2.0 Flash، طراحی شده است؛ اما این بار نه‌فقط با سرعت زیاد، بلکه با قابلیت‌های استدلالی بسیار پیشرفته‌تر منتشر شده است. این مدل به‌گونه‌ای ساخته شده است که توسعه‌دهندگان بتوانند بسته به نیاز خود، ویژگی Reasoning یا «پردازش منطقی» را فعال یا غیرفعال کنند. این ویژگی‌ به آن‌ها اجازه می‌دهد تا میان کیفیت و هزینه و زمان پاسخ‌دهی توازن ایجاد کنند.

به نقل از نئووین، برخلاف بسیاری از مدل‌های هوش مصنوعی که پردازش منطقی همواره در آن‌ها فعال است، در 2.5 Flash می‌توان این قابلیت را برای تسک‌های ساده مانند ترجمه یا بازنویسی خاموش کرد تا هزینه و تأخیر کاهش یابد. به‌عنوان نمونه، ترجمه عبارتی ساده مانند «Thank You» در زبان هندی به استدلال نیاز ندارد؛ اما حل معادله ریاضی پیچیده یا طراحی جدول برنامه‌ریزی روزانه، نیازمند درگیری پردازش منطقی مدل است.

02
از 05
ساختار قیمت‌گذاری انعطاف‌پذیر

مدل جدید ساختار قیمتی جذابی دارد که امکان استفاده گسترده از آن را فراهم می‌سازد:

۰٫۱۵ دلار برای هر یک‌میلیون توکن ورودی
۰٫۶۰ دلار برای هر یک‌میلیون توکن خروجی بدون استدلال
۳٫۵۰ دلار برای هر یک‌میلیون توکن خروجی با استدلال

این قیمت‌ها نشان می‌دهد که گوگل قصد دارد مدل‌های هوش مصنوعی را برای کاربردهای روزمره و حتی غیرتجاری نیز مقرون‌به‌صرفه‌تر کند.

03
از 05
بهبودهای عملکردی و نتایج بنچمارک

Gemini 2.5 Flash در مقایسه با نسخه قبلی خود، در آزمون مشهور Humanity’s Last Exam امتیاز ۱۲٫۱ درصد را به‌دست آورده است که از امتیاز ۵٫۱ درصدی Flash 2.0 بیش از دو برابر بهبود عملکرد را نشان می‌دهد. این نتیجه آن را بالاتر از مدل‌هایی مانند Claude 3.7 Sonnet و DeepSeek R1 قرار داده است؛ هرچند هنوز در رتبه‌ای پایین‌تر از مدل جدید o4-mini شرکت OpenAI قرار دارد.

بهبودهای عملکردی و نتایج بنچمارک پیش‌نمایش Gemini 2.5 Flash

همچنین، این مدل در رتبه‌بندی LMArena leaderboard، عملکردی نزدیک به مدل پرو دارد و به‌ویژه در تسک‌هایی مانند حل مسائل چندمرحله‌ای ریاضی، کدنویسی پیشرفته در پایتون، ساخت بازی‌های ساده و حتی تولید اسناد ساختاریافته عملکرد مطلوبی دارد.

04
از 05
تفاوت با مدل‌های رقیب

مدل‌های o3 و o4-mini از OpenAI تنها یک روز پیش‌از رونمایی Gemini 2.5 Flash منتشر شدند و رقابت شدیدی میان آن‌ها برای تصاحب رتبه‌های نخست در پلتفرم‌های مقایسه‌ای در جریان است. با اینکه مدل Flash جدید هنوز ابزارهایی مانند وب‌گردی زنده یا تحلیل فایل‌ها را ندارد، با هزینه اندک و انعطاف‌پذیری زیاد گزینه‌ای بسیار کاربردی برای توسعه‌دهندگان محسوب می‌شود.

05
از 05
امکانات گسترده

مدل Gemini 2.5 Flash از ویژگی‌های زیر برخوردار است:

پنجره متنی تا یک‌میلیون توکن
پشتیبانی از انواع ورودی‌ها: متنی، صوتی، تصویری و ویدئویی
توانایی تنظیم خودکار سطح استدلال با توجه به پیچیدگی درخواست
دانش به‌روز تا ژانویه ۲۰۲۵

در نهایت، عرضه این مدل را می‌توان حرکتی راهبردی گوگل برای رقابت با مدل‌های پیشرفته شرکت‌های رقیب دانست؛ به‌ویژه با درنظرگرفتن افزایش شدید هزینه مدل‌های هوش مصنوعی در بازار جهانی. Gemini 2.5 Flash ترکیبی از عملکرد و انعطاف‌پذیری مناسب و هزینه کم است که می‌تواند برای کاربران حرفه‌ای و سازمانی انتخابی هوشمندانه باشد.