مایکروسافت UI‑Evol را معرفی کرد تا عاملهای هوش مصنوعی بتوانند با دقت بیشتر و رفتار پایدارتر وظایف خودکار را در رابطهای کاربری انجام دهند.
به گزارش سرویس اخبار هوش مصنوعی تکناک، پژوهشگران واحد Research Asia مایکروسافت موفق شدهاند مؤلفه جدید آماده استفاده به نام UI‑Evol را توسعه دهند که برای هوش مصنوعیهای خودکار مرتبط با استفاده از کامپیوتر طراحی شده و هدف آن افزایش دقت و قابلیت اعتماد این نوع سیستمهاست. این عاملهای هوش مصنوعی که به سیستمعامل دسترسی دارند، بهصورت خودکار میتوانند وظایف را انجام دهند؛ اما تحقیقات نشان میدهند که هنوز از نظر دقت عملکرد رضایتبخشی ندارند.
این مدلها معمولاً برای انجام وظایف خود به اطلاعات اینترنتی متکیاند تا نحوه تعامل با رابطهای کاربری را بیاموزند. بااینحال، ازآنجاکه رابطهای کاربری دائماً درحال تغییرند، این مدلها اغلب نمیتوانند دانشی که از اینترنت کسب کردهاند، به عملکرد واقعی در نرمافزار تبدیل کنند؛ مشکلی که مایکروسافت آن را «شکاف دانشیعملیاتی» مینامد.
در یکی از مطالعات مایکروسافت مشخص شد که حتی وقتی دستورها با دقت ۹۰ درصد صادر میشوند، هوش مصنوعیها فقط در ۴۱ درصد موارد موفق میشوند وظیفه را درست انجام دهند. علاوهبراین، این عاملها رفتار پیشبینیناپذیر دارند و هر بار که وظیفه مشابهی را اجرا میکنند، نتایج متفاوتی میدهند. مایکروسافت برای رفع این نقص تصمیم گرفت ساختاری جدید طراحی کند.
در همین زمینه، UI‑Evol معرفی شد؛ مؤلفهای مستقل و آماده که به جریان کاری عاملهای هوش مصنوعی اضافه میشود و بهجای تکیه بر دادههای اینترنتی، از رابط کاربری واقعی سیستم برای هدایت و یادگیری استفاده میکند. هدف از طراحی این ابزار بهروزرسانی دائم دانش رابط کاربری و افزایش ثبات و دقت عملکرد هوش مصنوعیهاست.

UI‑Evol از فرایند دومرحلهای بهره میبرد. در مرحله اول، روش Retrace اجرا میشود که طی آن تمام مراحل انجام موفقیتآمیز وظیفه (از قبیل کلیکها و فشردن کلیدها و اقدامات عملی) ثبت میشوند. در مرحله دوم، روش Critique به کار برده میشود تا این اقدامات با دستورالعملهای خارجی مقایسه شوند. اگر اختلافی بین رفتار واقعی و دستورها وجود داشته باشد، سیستم دانش خود را براساس نتیجه واقعی تنظیم میکند تا راهنمایی مشخص و مطمئن برای محیط نرمافزار ایجاد شود.
به نقل از نئووین، برای سنجش کارایی این مؤلفه، تیم تحقیقاتی آن را روی یکی از عاملهای پیشرفته هوش مصنوعی حوزه کامپیوتر، Agent S2، آزمایش کرد و از بنچمارک OSWorld بهره گرفت. نتایج آزمایش با عاملهایی مبتنیبر مدلهای زبانی بزرگ (LLMs) مانند GPT‑4o و GPT‑o3 شرکت OpenAI دو بهبود مهم را نشان داد: افزایش نرخ موفقیت در انجام وظایف و کاهش انحراف رفتاری (رفتار پایدارتر و پیشبینیپذیرتر) که درمجموع به افزایش پایایی عملکرد عاملها منجر شد.
با ارائه UI‑Evol، مایکروسافت گامی مؤثر برای ارتقای کیفیت و اعتمادپذیری هوش مصنوعیهای کاربرمحور برداشته است؛ اقدامی که میتواند آینده ابزارهای اتوماسیون اداری و دستیارهای مجازی را بهطور چشمگیری متحول کند.

















