گوگل روز سه شنبه در کنفرانس توسعه دهندگان سالانه Google I/O 2024 یک ویژگی جستجوی جدید با نام “Ask Photos” برای Google Photos معرفی کرد که با استفاده از هوش مصنوعی Gemini کار میکند و به کاربران امکان میدهد تا با استفاده از زبان طبیعی به جستجو در عکسهای خود بپردازند.
به گزارش تکناک و به نقل از Techcrunch،گوگل اعلام کرد که به لطف پیشرفتها در پردازش زبان طبیعی، هوش مصنوعی اکنون قادر است جستجوی محتوا در عکسها را برای کاربران آسانتر و کمتر وابسته به جستجوی دستی کند. این پیشرفت به کاربران امکان میدهد به طور شهودیتری افراد، مکانها و اشیاء خاصی را در تصاویر خود بیابند.
برای مثال، به جای جستجوی چیزی خاص در عکسهایتان، مانند «برج ایفل»، اکنون میتوانید از هوش مصنوعی بخواهید کار پیچیدهتری انجام دهد، مانند پیدا کردن «بهترین عکس از هر کدام از پارکهای ملی که بازدید کردهام». هوش مصنوعی از سیگنالهای مختلفی برای تعیین بهترین عکس از یک مجموعه خاص استفاده میکند، از جمله مواردی مانند نور، تاری، عدم اعوجاج پسزمینه و موارد دیگر.
سپس میتواند آن را با درک خود از موقعیت جغرافیایی مجموعه عکسها یا تاریخها ترکیب کند تا فقط تصاویری را که در پارکهای ملی ایالات متحده گرفته شدهاند بازیابی کند.
ویژگی جدید بر پایهی راهاندازی اخیر Photo Stacks در Google Photos استوار است که عکسهای تقریباً مشابه را دستهبندی کرده و از هوش مصنوعی برای برجسته کردن بهترین عکسها در هر گروه استفاده میکند. هدف از Photo Stacks این است که به کاربران کمک کند تا با رشد مجموعههای دیجیتالی خود، به راحتی عکسهای مورد نظرشان را بیابند.
گوگل اعلام کرده است که روزانه بیش از 6 میلیارد تصویر در Google Photos آپلود میشود، که نشاندهندهی مقیاس وسیع استفاده از این سرویس است.
علاوه بر این، ویژگی جدید «Ask Photos» به کاربران امکان میدهد سوالات مختلفی را مطرح کنند تا پاسخهای مفیدتری دریافت کنند. این ویژگی فراتر از صرفاً درخواست نشان دادن بهترین عکسها از تعطیلات یا سایر رویدادها است، و به کاربران این امکان را میدهد که سوالاتی پیچیدهتر مطرح کنند که نیازمند درک عمیقتر و تقریباً انسانی از محتوای عکسها است.
این امکان جدید، تعامل با آلبومهای دیجیتالی را به سطحی جدید میبرد و کاربران را قادر میسازد تا به طور دقیقتر و هوشمندانهتری با مجموعه عکسهای خود ارتباط برقرار کنند.
برای مثال، از طریق ویژگی «Ask Photos» در Google Photos، یک والدین میتواند پرسشی مانند این مطرح کند که از چه تمهایی برای چهار جشن تولد آخر فرزند خود استفاده کردهاند.
Google Photos به طور خودکار میتواند تمهای استفاده شده در جشنها را شناسایی کند و به این سوال پاسخ دهد. به این ترتیب، والدین میتوانند اطلاعاتی دقیق دریافت کنند در مورد تمهایی که در گذشته برای جشنهای تولد فرزندشان استفاده شده، مانند پری دریایی، شاهزاده خانم، و تکشاخ، به همراه زمان برگزاری هر جشن و نمایش عکسها و ویدیوهای مربوط به هر تم. این امکان جستجوی پیشرفته، تجربهی کاربری غنی و اختصاصی را برای کاربران فراهم میآورد.
این نوع جستجو به این دلیل امکان پذیر است که Google Photos نه تنها کلمات کلیدی وارد شده توسط شما را درک می کند، بلکه مفاهیم زبان طبیعی مانند “جشن تولد با تم خاص” را نیز درک می کند. همچنین می تواند از توانایی های چند حالته هوش مصنوعی برای درک اینکه آیا متنی در عکس وجود دارد که ممکن است با جستجو مرتبط باشد، استفاده کند.
مثال دیگری که ساندرا پیچای مدیرعامل قبل از کنفرانس توسعه دهندگان Google I/O امروز برای مطبوعات به نمایش گذاشت، نشان داد که کاربری از هوش مصنوعی می خواهد تا پیشرفت شنا فرزندش را به او نشان دهد. هوش مصنوعی مجموعه ای از عکس ها و فیلم های مربوط به شنا کردن کودک را در طول زمان در یک بسته قرار داد.
یکی دیگر از ویژگی های جدید، استفاده از جستجو برای یافتن پاسخ از متن موجود در عکس ها است. به این ترتیب، می توانید از چیزی که می خواهید بعداً به خاطر بسپارید، مانند پلاک خودرو یا شماره پاسپورت خود، عکس بگیرید و سپس از هوش مصنوعی بخواهید آن اطلاعات را در صورت نیاز بازیابی کند.
اگر هوش مصنوعی هر بار اشتباه کند و شما آن را اصلاح کنید آن پاسخ را به خاطر می آورد تا با گذشت زمان بهبود یابد. این همچنین به این معنی است که هر چه بیشتر با هوش مصنوعی تعامل داشته باشید، شخصی تر می شود.
هنگامی که عکس هایی را پیدا کردید که برای به اشتراک گذاری آماده هستید، هوش مصنوعی می تواند به نوشتن زیرنویسی کمک کند که محتوای عکس ها را خلاصه کند. با این حال، در حال حاضر این یک خلاصه اولیه است که امکان انتخاب از سبک های مختلف را ارائه نمی دهد. (اما با توجه به اینکه از Gemini در زیرساخت خود استفاده میکند، ممکن است یک دستور هوشمندانه برای بازگرداندن سبک خاصی در صورت تلاش شما کارساز باشد.)
گوگل در راستای راهاندازی ویژگی جدید «Ask Photos»، اعلام کرده است که محدودیتهایی را برای جلوگیری از پاسخگویی به برخی درخواستهای نامناسب اعمال کرده است؛ مثلاً، پاسخگویی به درخواستهایی که ممکن است شامل تصاویر برهنه باشند.
این شرکت تاکید کرده که محتوای توهینآمیز در طی آموزش مدل لحاظ نشده است. با این حال، این ویژگی به عنوان آزمایشی معرفی شده و ممکن است در آینده نیاز به کنترلهای اضافی پیدا کند تا به نحوه استفاده کاربران از آن پاسخ دهد.
ویژگی «Ask Photos» ابتدا در ایالات متحده و به زبان انگلیسی پشتیبانی میشود و قرار است به تدریج به بازارهای بیشتری گسترش یابد. در حال حاضر، این ویژگی به صورت متنبنیان است و شبیه به پرسش از یک چتبات هوش مصنوعی عمل میکند. با گذشت زمان، این ویژگی ممکن است بیشتر با Gemini، که بر روی دستگاههای اندروید اجرا میشود، همگرا شود.
گوگل تاکید کرده که دادههای شخصی کاربران در Google Photos برای مقاصد تبلیغاتی استفاده نمیشوند و انسانها به ندرت به گفتگوهای AI و دادههای شخصی در «Ask Photos» دسترسی پیدا میکنند، مگر در مواردی که برای مقابله با سوءاستفاده یا آسیب ضروری باشد. همچنین، این دادهها برای آموزش سایر محصولات هوش مصنوعی مانند Gemini استفاده نمیشوند.