گوگل در کنفرانس Google I/O 2024 از قابلیتهای جدید Gemini بر روی اندروید رونمایی کرد.
به گزارش تکناک،به زودی، کاربران اندروید قادر خواهند بود تصاویر تولید شده توسط هوش مصنوعی Gemini را به طور مستقیم به جیمیل، پیامهای گوگل و سایر برنامهها منتقل کنند.
گوگل میگوید در همین حال، کاربران یوتیوب میتوانند با ضربه زدن روی « Ask this video »، اطلاعات خاصی را از درون آن ویدیوی یوتیوب پیدا کنند.
کاربرانی که برای نسخه پیشرفته بهروزرسانی شده Gemini هزینه پرداخت میکنند، همچنین این امکان را خواهند داشت که از گزینه « Ask this PDF » استفاده کنند که به آنها اجازه میدهد بدون نیاز به خواندن تمام صفحات، پاسخهایی را از آن سند دریافت کنند.
مشترکین جمینی پیشرفته برای دسترسی به هوش مصنوعی و دریافت 2 ترابایت فضای ذخیرهسازی به همراه سایر مزایای گوگل وان، ماهانه 19.99 دلار هزینه پرداخت میکنند.
در حال حاضر، Gemini روی اندروید میتواند کارهای دیگری مانند ایجاد زیرنویس روی عکسها، پرسیدن سوال درباره مقالاتی که میخوانید و انجام سایر کارهای مبتنی بر هوش مصنوعی مولد ، مشابه سایر چتباتهای هوش مصنوعی انجام دهد. با این حال، کمپانی OpenAI با معرفی مدل GenAI به نام GPT-4o (با o نشاندهنده «همهجانبه»)، که با متن، گفتار و ویدیو، از جمله تصویری که دوربین گوشی میبیند کار میکند، رویداد گوگل را تحت الشعاع قرار داد. بنابراین، با وجود مزایای داخلی Gemini ، این قابلیت در دستگاههای تلفن همراه با رقابتی روبرو خواهد شد.
گوگل میگوید جدیدترین قابلیتهای Gemini روی اندروید طی چند ماه آینده در اختیار صدها میلیون دستگاه پشتیبانیشده قرار خواهد گرفت. با گذشت زمان، جمینی برای ارائه پیشنهادهای دیگری مرتبط با آنچه روی صفحه نمایش شما است نیز تکامل خواهد یافت.
در همین حال، مدل پایهای روی دستگاه در اندروید، یعنی Gemini نانو، برای گنجاندن چندوجهی بودن ارتقا خواهد یافت. این بدان معناست که این مدل قادر خواهد بود علاوه بر ورودی متن، سایر روشهای پردازش اطلاعات، از جمله تصاویر، صداها و زبان گفتاری را نیز پردازش کند.