شرکت مایکروسافت به تازگی ویژگی جدیدی به نام Copilot Vision را به صورت رایگان به مرورگر اج در سیستمعامل ویندوز 11 اضافه کرد.
به گزارش تکناک، این ویژگی که ابتدا تنها برای کاربران با اشتراک Pro در ایالات متحده در دسترس بود، اکنون برای تمام کاربران رایگان (بدون نیاز به اشتراک Pro) نیز در دسترس قرار گرفته است. هرچند، این ویژگی تنها در ایالات متحده قابل استفاده است.

ویژگی Copilot Vision در مرورگر اج به کاربران این امکان را میدهد که با هر صفحه وب تعامل داشته باشند و به طور مستقیم با آن چت کنند. وبسایت Windows Latest در گزارشی اشاره کرده که این ویژگی جدید را در یک ماشین مجازی با موقعیت جغرافیایی ایالات متحده و از طریق مرورگر اج آزمایش کرده است. تیم بررسی این ویژگی برای شروع، با انجام یک جستوجو در Bing برای Copilot Vision، روی نتیجه جستوجوی مربوطه کلیک و گزینه “Try it now” را انتخاب کردند. سپس شرایط و ضوابط استفاده از این ویژگی را پذیرفتند.
شرکت مایکروسافت یک پیشنمایش کوتاه از نحوه عملکرد Vision ارائه داد، اما این پیشنمایش برای کاربران کافی نبود، چرا که نتواستند به طور کامل نحوه استفاده از آن را درک کنند. برای استفاده از Copilot Vision در مرورگر اج، کاربران باید از طریق نوار کناری Copilot را باز و روی آیکون میکروفن کلیک کنند. پس از انجام این کار، آیکون عینک همراه با دکمه میکروفن و دو دکمه دیگر به طور خودکار در پایین صفحه ظاهر میشود. در صورتی که آیکون عینک برجسته باشد، به معنای فعال بودن Vision است، که در این حالت قادر است صفحه وب را مشاهده کند.

کاربران با استفاده از Copilot Vision، میتوانند برای درخواست توضیحاتی درباره محتوای صفحات وب استفاده کنند. به عنوان مثال، یکی از آزمایشها نشان داد که وقتی از Copilot Vision خواسته شد تا صفحه وب مایکروسافت را توصیف کند، به درستی قادر به توضیح کامل صفحه نبود و حتی در میانه مکالمه قطع شد. کاربران پس از چندین تلاش برای دریافت پاسخ صحیح، متوجه شدند که این ویژگی در یک حلقه از پاسخهای ناقص گیر میکند و قادر به ارائه یک مکالمه روان و پیوسته نیست.
علاوه بر این، Copilot Vision هنگام بررسی برخی دکمهها در صفحه وب، تنها موفق به شناسایی یک دکمه برجسته به نام “Try it” شد و نتواست دکمه دوم که مربوط به پخش ویدیو بود را شناسایی کند. همچنین درخواستهای مختلف از جمله تعامل با صفحه وب یا پخش ویدیو توسط Copilot رد شد. Copilot در پاسخ به درخواست برای توقف صحبت، اعلام کرد که به هیچ یک از اجزای صفحه دسترسی ندارد.
ویژگی Copilot Vision در بررسیهای بعدی توانست به درستی یک مقاله را توصیف کند و حتی در شناسایی اطلاعاتی درباره نویسنده مقاله موفق بود. این نشان میدهد که Copilot Vision پتانسیل قابل توجهی دارد، اما برای اینکه مفید و کارآمد باشد، نیازمند بهبودهای زیادی است.
در آزمایشهای بعدی که شامل مقایسه SSDها از برندهای مختلف بود، ویژگی Copilot Vision در مرورگر اج نتواست اطلاعاتی فراتر از آنچه که روی صفحه قابل مشاهده بود، پیدا کند. حتی زمانی که از آن خواسته شد تا عملکرد SSDها را بررسی کند، قادر به ارائه اطلاعات دقیق نبود. همچنین درخواست برای جستوجوی اطلاعات بیشتر در Bing نیز توسط Copilot رد شد.
علاوه بر این، ویژگی Copilot Vision با محدودیتهایی روبهرو است، چرا که فقط قادر به اسکن ناحیه قابل مشاهده صفحه است و نمیتواند تمامی محتوای صفحه را بررسی کند. به عنوان مثال، زمانی که از آن خواسته شد تا اقلام تبلیغاتی صفحه را شناسایی کند، تنها موفق به شناسایی Sandisk شد و نتواست Samsung تبلیغشده در همان صفحه را شناسایی کند. پس از اسکرول صفحه، دیگر نتواست به یاد بیاورد که پیشتر Sandisk را شناسایی کرده بود.
نتایج این آزمایشها نشان میدهد که Copilot Vision با وجود پتانسیلها، هنوز مشکلات زیادی دارد و عملکرد آن در شرایط مختلف چندان قابل اعتماد نیست. این مسائل توضیح میدهد که چرا این ویژگی به صورت رایگان برای همه کاربران منتشر شده است. همچنین Copilot Vision به طور مداوم تلاش میکند تا رضایت کاربران را جلب کند و پس از شناسایی اشتباهات خود، به طور واضح فروتن میشود.
در نهایت، کارشناسان بر این باور هستند که مایکروسافت باید ویژگیهای جدیدی مانند قابلیت اسکرول یا اسکن کامل صفحه را به Vision اضافه کند تا این ابزار بتواند عملکرد بهتری ارائه دهد و از این طریق ارزش بیشتری برای کاربران خود ایجاد کند.