گوگل ویژگی جدیدی به نام «ذخیرهسازی ضمنی» (Implicit Caching) را برای API مدلهای زبانی Gemini 2.5 Pro و 2.5 Flash معرفی کرد. این قابلیت بهصورت خودکار فعال بوده و با شناسایی بخشهای تکراری در درخواستها، هزینه پردازش را تا ۷۵ درصد کاهش میدهد.
به گزارش تکناک، این ویژگی جدید به طور خاص برای مدلهای جمنی ۲.۵ پرو و ۲.۵ فلش طراحی شده است و به کاربران امکان میدهد تا در صورت ارسال درخواستهای مشابه یا تکراری، از صرفهجویی ۷۵ درصدی در هزینهها بهرهمند شوند. گوگل توضیح داده است که کشینگ ضمنی به طور خودکار برای کاربران فعال میشود و در مقایسه با کشینگ صریح، نیاز به تنظیمات دستی کمتری دارد.
کشینگ، که یک روش استاندارد در صنعت هوش مصنوعی است، به طور کلی به معنای ذخیرهسازی دادههای تکراری یا محاسبات از پیش انجامشده است تا نیاز به پردازش مجدد اطلاعات کاهش یابد. بهعنوان مثال، اگر کاربری سوالی را از یک مدل هوش مصنوعی بپرسد که قبلاً پاسخ داده شده است، کش میتواند آن پاسخ را ذخیره کرده و دوباره محاسبه نشود.

در گذشته، گوگل ویژگی کشینگ پروپمپت را معرفی کرده بود که توسعهدهندگان مجبور بودند خودشان درخواستهای پر تکرار را تعریف کنند. این ویژگی اگرچه منجر به صرفهجویی در هزینهها میشد، اما نیاز به کار دستی زیادی داشت. از سوی دیگر، کشینگ ضمنی به طور خودکار و بدون نیاز به تنظیمات دستی عمل میکند.
به نقل از تککرانچ، گوگل در پست وبلاگی خود توضیح داد که زمانی که یک درخواست جدید به مدلهای جمنی ۲.۵ ارسال میشود و آن درخواست با یکی از درخواستهای قبلی همپوشانی داشته باشد، هزینههای مربوط به آن درخواست کاهش پیدا میکند. این ویژگی از حداقل ۱۰۲۴ توکن برای مدل ۲.۵ فلش و ۲۰۴۸ توکن برای مدل ۲.۵ پرو پشتیبانی میکند. توکنها در واقع بخشهای دادهای هستند که مدلهای هوش مصنوعی با آنها کار میکنند، و ۱۰۰۰ توکن معادل حدود ۷۵۰ کلمه است.
با این حال، این ویژگی جدید بدون چالش نبوده است. گوگل توصیه کرده است که توسعهدهندگان زمینههای تکراری را در ابتدای درخواستها قرار دهند تا احتمال کشینگ افزایش یابد. زمینههایی که ممکن است در درخواستهای مختلف تغییر کنند، باید در انتهای درخواست اضافه شوند. همچنین، گوگل هیچ تاییدیهای از طرف سوم برای تضمین صحت عملکرد کشینگ ضمنی ارائه نکرده است، بنابراین باید منتظر تجربیات اولیه کاربران و ارزیابیهای آنها بود.
ویژگی کشینگ ضمنی در زمان افزایش هزینههای استفاده از مدلهای پیشرفته هوش مصنوعی، میتواند به توسعهدهندگان کمک کند تا از بار مالی ناشی از استفاده مکرر از مدلها بکاهند. در حال حاضر، با توجه به نگرانیها درباره هزینههای بالای API، این ویژگی جدید میتواند برای بسیاری از توسعهدهندگان خوشایند باشد.