گوگل لنز، ابزار قدرتمند تشخیص تصویر گوگل، در جدیدترین بهروزرسانی خود امکان جستوجوی ویدئویی را فراهم میکند.
بهگزارش تکناک، گوگل لنز با افزودن قابلیت جستوجوی ویدئویی و پرسشوپاسخ صوتی، تجربهی جستوجو را ارتقا داده است. این ابزار با بهرهگیری از هوش مصنوعی، میتواند براساس محتوای ویدئو و پرسش کاربر، نتایج جستوجو را بهطور دقیق ارائه کند. درحالحاضر، این ویژگی در مرحلهی آزمایشی برای سیستمعاملهای اندروید و iOS قرار دارد.
در کنفرانس I/O ماه می، گوگل قابلیت جستوجوی تصویری با استفاده از ویدئو را در گوگل لنز معرفی کرد. کاربر میتواند با ضبط ویدئویی از سوژه مدنظر و سؤالکردن بهصورت صوتی، از مدل هوش مصنوعی جمنای برای دریافت پاسخ بهرهمند شود. بهعنوان مثال، با ضبط ویدیویی از ماهیهای آکواریوم و پرسیدن دلیل شناکردن گروهی آنها، گوگل لنز میتواند پاسخ مناسبی ارائه دهد.
راجان پاتل، معاون مهندسی گوگل، در مصاحبه با ورج بیان کرد که گوگل با تجزیهوتحلیل ویدئو به فریمهای متعدد و اعمال تکنیکهای بینایی کامپیوتری مشابهی که قبلاً در گوگل لنز استفاده میشد، محتوا را بررسی میکند. گوگل با استفاده از مدل سفارشی جمنای که برای درک توالی فریمها و ارائهی پاسخهای مبتنیبر وب طراحی شده است، گامهای پیشرفتهتری در این زمینه برداشته است.
ورج مینویسد که درحالحاضر، گوگل لنز توانایی شناسایی صداهای موجود در ویدئو را ندارد. بهعنوان مثال، شناسایی گونهی پرندگان براساس صدای آنها هنوز پشتیبانی نمیشود. بااینحال، گوگل اعلام کرده است که در حال کار روی این قابلیت است.
گوگل لنز جستوجوی صوتی را نیز به ویژگی جستوجوی عکس خود اضافه کرده است. کاربران اکنون میتوانند با نگهداشتن دکمه شاتر و سؤالکردن بهصورت صوتی، اطلاعات مدنظر خود را بهدست آورند. پیشازاین، سؤالکردن فقط بهصورت متنی امکانپذیر بود. این ویژگی جدید برای کاربران سیستمعاملهای اندروید و iOS سراسر جهان در حال انتشار است؛ اما درحالحاضر، تنها به زبان انگلیسی قابلیت استفاده دارد.