مایکروسافت با UI‑Evol مسیر اتوماسیون کارآمد و مطمئن را هموار می‌کند

مایکروسافت UI‑Evol را معرفی کرد تا عامل‌های هوش مصنوعی بتوانند با دقت بیشتر و رفتار پایدارتر وظایف خودکار را در رابط‌های کاربری انجام دهند.

به گزارش سرویس اخبار هوش مصنوعی تک‌ناک، پژوهشگران واحد Research Asia مایکروسافت موفق ‌شده‌اند مؤلفه جدید آماده استفاده به نام UI‑Evol را توسعه دهند که برای هوش مصنوعی‌های خودکار مرتبط با استفاده از کامپیوتر طراحی شده و هدف آن افزایش دقت و قابلیت اعتماد این نوع سیستم‌هاست. این عامل‌های هوش مصنوعی که به سیستم‌عامل دسترسی دارند، به‌صورت خودکار می‌توانند وظایف را انجام دهند؛ اما تحقیقات نشان می‌دهند که هنوز از نظر دقت عملکرد رضایت‌بخشی ندارند.

این مدل‌ها معمولاً برای انجام وظایف خود به اطلاعات اینترنتی متکی‌اند تا نحوه تعامل با رابط‌های کاربری را بیاموزند. بااین‌حال، ازآنجاکه رابط‌های کاربری دائماً در‌حال تغییرند، این مدل‌ها اغلب نمی‌توانند دانشی که از اینترنت کسب کرده‌اند، به عملکرد واقعی در نرم‌افزار تبدیل کنند؛ مشکلی که مایکروسافت آن را «شکاف دانشی‌عملیاتی» می‌نامد.

در یکی از مطالعات مایکروسافت مشخص شد که حتی وقتی دستورها با دقت ۹۰ درصد صادر می‌شوند، هوش مصنوعی‌ها فقط در ۴۱ درصد موارد موفق می‌شوند وظیفه را درست انجام دهند. علاوه‌براین، این عامل‌ها رفتار پیش‌بینی‌ناپذیر دارند و هر بار که وظیفه مشابهی را اجرا می‌کنند، نتایج متفاوتی می‌دهند. مایکروسافت برای رفع این نقص تصمیم گرفت ساختاری جدید طراحی کند.

در همین زمینه، UI‑Evol معرفی شد؛ مؤلفه‌ای مستقل و آماده که به جریان کاری عامل‌های هوش مصنوعی اضافه می‌شود و به‌جای تکیه بر داده‌های اینترنتی، از رابط کاربری واقعی سیستم برای هدایت و یادگیری استفاده می‌کند. هدف از طراحی این ابزار به‌روزرسانی دائم دانش رابط کاربری و افزایش ثبات و دقت عملکرد هوش مصنوعی‌هاست.

UI‑Evol از فرایند دو‌مرحله‌ای بهره می‌برد. در مرحله اول، روش Retrace اجرا می‌شود که طی آن تمام مراحل انجام موفقیت‌آمیز وظیفه (از قبیل کلیک‌ها و فشردن کلیدها و اقدامات عملی) ثبت می‌شوند. در مرحله دوم، روش Critique به کار برده می‌شود تا این اقدامات با دستورالعمل‌های خارجی مقایسه شوند. اگر اختلافی بین رفتار واقعی و دستورها وجود داشته باشد، سیستم دانش خود را براساس نتیجه واقعی تنظیم می‌کند تا راهنمایی مشخص و مطمئن برای محیط نرم‌افزار ایجاد شود.

به نقل از نئووین، برای سنجش کارایی این مؤلفه، تیم تحقیقاتی آن را روی یکی از عامل‌های پیشرفته هوش مصنوعی حوزه کامپیوتر، Agent S2، آزمایش کرد و از بنچمارک OSWorld بهره گرفت. نتایج آزمایش با عامل‌هایی مبتنی‌بر مدل‌های زبانی بزرگ (LLMs) مانند GPT‑4o و GPT‑o3 شرکت OpenAI دو بهبود مهم را نشان داد: افزایش نرخ موفقیت در انجام وظایف و کاهش انحراف رفتاری (رفتار پایدارتر و پیش‌بینی‌پذیرتر) که درمجموع به افزایش پایایی عملکرد عامل‌ها منجر شد.

با ارائه UI‑Evol، مایکروسافت گامی مؤثر برای ارتقای کیفیت و اعتمادپذیری هوش مصنوعی‌های کاربرمحور برداشته است؛ اقدامی که می‌تواند آینده ابزارهای اتوماسیون اداری و دستیارهای مجازی را به‌طور چشمگیری متحول کند.