گوگل از ویژگی Ask Photos برای برنامه Google Photos رونمایی کرد

گوگل روز سه شنبه در کنفرانس توسعه دهندگان سالانه Google I/O 2024 یک ویژگی جستجوی جدید با نام “Ask Photos” برای Google Photos معرفی کرد که با استفاده از هوش مصنوعی Gemini کار می‌کند و به کاربران امکان می‌دهد تا با استفاده از زبان طبیعی به جستجو در عکس‌های خود بپردازند.

به گزارش تکناک و به نقل از Techcrunch،گوگل اعلام کرد که به لطف پیشرفت‌ها در پردازش زبان طبیعی، هوش مصنوعی اکنون قادر است جستجوی محتوا در عکس‌ها را برای کاربران آسان‌تر و کمتر وابسته به جستجوی دستی کند. این پیشرفت به کاربران امکان می‌دهد به طور شهودی‌تری افراد، مکان‌ها و اشیاء خاصی را در تصاویر خود بیابند.

برای مثال، به جای جستجوی چیزی خاص در عکس‌هایتان، مانند «برج ایفل»، اکنون می‌توانید از هوش مصنوعی بخواهید کار پیچیده‌تری انجام دهد، مانند پیدا کردن «بهترین عکس از هر کدام از پارک‌های ملی که بازدید کرده‌ام». هوش مصنوعی از سیگنال‌های مختلفی برای تعیین بهترین عکس از یک مجموعه خاص استفاده می‌کند، از جمله مواردی مانند نور، تاری، عدم اعوجاج پس‌زمینه و موارد دیگر.

سپس می‌تواند آن را با درک خود از موقعیت جغرافیایی مجموعه عکس‌ها یا تاریخ‌ها ترکیب کند تا فقط تصاویری را که در پارک‌های ملی ایالات متحده گرفته شده‌اند بازیابی کند.

ویژگی جدید بر پایه‌ی راه‌اندازی اخیر Photo Stacks در Google Photos استوار است که عکس‌های تقریباً مشابه را دسته‌بندی کرده و از هوش مصنوعی برای برجسته کردن بهترین عکس‌ها در هر گروه استفاده می‌کند. هدف از Photo Stacks این است که به کاربران کمک کند تا با رشد مجموعه‌های دیجیتالی خود، به راحتی عکس‌های مورد نظرشان را بیابند.

گوگل اعلام کرده است که روزانه بیش از 6 میلیارد تصویر در Google Photos آپلود می‌شود، که نشان‌دهنده‌ی مقیاس وسیع استفاده از این سرویس است.

علاوه بر این، ویژگی جدید «Ask Photos» به کاربران امکان می‌دهد سوالات مختلفی را مطرح کنند تا پاسخ‌های مفیدتری دریافت کنند. این ویژگی فراتر از صرفاً درخواست نشان دادن بهترین عکس‌ها از تعطیلات یا سایر رویدادها است، و به کاربران این امکان را می‌دهد که سوالاتی پیچیده‌تر مطرح کنند که نیازمند درک عمیق‌تر و تقریباً انسانی از محتوای عکس‌ها است.

این امکان جدید، تعامل با آلبوم‌های دیجیتالی را به سطحی جدید می‌برد و کاربران را قادر می‌سازد تا به طور دقیق‌تر و هوشمندانه‌تری با مجموعه عکس‌های خود ارتباط برقرار کنند.

برای مثال، از طریق ویژگی «Ask Photos» در Google Photos، یک والدین می‌تواند پرسشی مانند این مطرح کند که از چه تم‌هایی برای چهار جشن تولد آخر فرزند خود استفاده کرده‌اند.

Google Photos به طور خودکار می‌تواند تم‌های استفاده شده در جشن‌ها را شناسایی کند و به این سوال پاسخ دهد. به این ترتیب، والدین می‌توانند اطلاعاتی دقیق دریافت کنند در مورد تم‌هایی که در گذشته برای جشن‌های تولد فرزندشان استفاده شده، مانند پری دریایی، شاهزاده خانم، و تکشاخ، به همراه زمان برگزاری هر جشن و نمایش عکس‌ها و ویدیوهای مربوط به هر تم. این امکان جستجوی پیشرفته، تجربه‌ی کاربری غنی و اختصاصی را برای کاربران فراهم می‌آورد.

این نوع جستجو به این دلیل امکان پذیر است که Google Photos نه تنها کلمات کلیدی وارد شده توسط شما را درک می کند، بلکه مفاهیم زبان طبیعی مانند “جشن تولد با تم خاص” را نیز درک می کند. همچنین می تواند از توانایی های چند حالته هوش مصنوعی برای درک اینکه آیا متنی در عکس وجود دارد که ممکن است با جستجو مرتبط باشد، استفاده کند.

مثال دیگری که ساندرا پیچای مدیرعامل قبل از کنفرانس توسعه دهندگان Google I/O امروز برای مطبوعات به نمایش گذاشت، نشان داد که کاربری از هوش مصنوعی می خواهد تا پیشرفت شنا فرزندش را به او نشان دهد. هوش مصنوعی مجموعه ای از عکس ها و فیلم های مربوط به شنا کردن کودک را در طول زمان در یک بسته قرار داد.

یکی دیگر از ویژگی های جدید، استفاده از جستجو برای یافتن پاسخ از متن موجود در عکس ها است. به این ترتیب، می توانید از چیزی که می خواهید بعداً به خاطر بسپارید، مانند پلاک خودرو یا شماره پاسپورت خود، عکس بگیرید و سپس از هوش مصنوعی بخواهید آن اطلاعات را در صورت نیاز بازیابی کند.

Screenshot

اگر هوش مصنوعی هر بار اشتباه کند و شما آن را اصلاح کنید آن پاسخ را به خاطر می آورد تا با گذشت زمان بهبود یابد. این همچنین به این معنی است که هر چه بیشتر با هوش مصنوعی تعامل داشته باشید، شخصی تر می شود.

هنگامی که عکس هایی را پیدا کردید که برای به اشتراک گذاری آماده هستید، هوش مصنوعی می تواند به نوشتن زیرنویسی کمک کند که محتوای عکس ها را خلاصه کند. با این حال، در حال حاضر این یک خلاصه اولیه است که امکان انتخاب از سبک های مختلف را ارائه نمی دهد. (اما با توجه به اینکه از Gemini در زیرساخت خود استفاده می‌کند، ممکن است یک دستور هوشمندانه برای بازگرداندن سبک خاصی در صورت تلاش شما کارساز باشد.)

گوگل در راستای راه‌اندازی ویژگی جدید «Ask Photos»، اعلام کرده است که محدودیت‌هایی را برای جلوگیری از پاسخ‌گویی به برخی درخواست‌های نامناسب اعمال کرده است؛ مثلاً، پاسخ‌گویی به درخواست‌هایی که ممکن است شامل تصاویر برهنه باشند.

این شرکت تاکید کرده که محتوای توهین‌آمیز در طی آموزش مدل لحاظ نشده است. با این حال، این ویژگی به عنوان آزمایشی معرفی شده و ممکن است در آینده نیاز به کنترل‌های اضافی پیدا کند تا به نحوه استفاده کاربران از آن پاسخ دهد.

ویژگی «Ask Photos» ابتدا در ایالات متحده و به زبان انگلیسی پشتیبانی می‌شود و قرار است به تدریج به بازارهای بیشتری گسترش یابد. در حال حاضر، این ویژگی به صورت متن‌بنیان است و شبیه به پرسش از یک چت‌بات هوش مصنوعی عمل می‌کند. با گذشت زمان، این ویژگی ممکن است بیشتر با Gemini، که بر روی دستگاه‌های اندروید اجرا می‌شود، همگرا شود.

گوگل تاکید کرده که داده‌های شخصی کاربران در Google Photos برای مقاصد تبلیغاتی استفاده نمی‌شوند و انسان‌ها به ندرت به گفتگوهای AI و داده‌های شخصی در «Ask Photos» دسترسی پیدا می‌کنند، مگر در مواردی که برای مقابله با سوءاستفاده یا آسیب ضروری باشد. همچنین، این داده‌ها برای آموزش سایر محصولات هوش مصنوعی مانند Gemini استفاده نمی‌شوند.

 

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار جدید تک‌ناک را از دست ندهید.