• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » معرفی چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی

معرفی چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 1 شهریور 1404 - 12:40
در اخبار هوش مصنوعی, فناوری
معرفی چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. چالش‌های توسعه عامل‌های رایانه‌ای
  • 2. معرفی چارچوب متن‌باز OpenCUA
  • 3. ملاحظات امنیت و حریم خصوصی
  • 4. AgentNetBench؛ معیار تازه برای ارزیابی
  • 5. دستورالعمل نوین آموزش با چارچوب متن‌باز OpenCUA
  • 6. آزمایش و نتایج چارچوب متن‌باز OpenCUA
  • 7. یافته‌های کلیدی برای سازمان‌ها
  • 8. آینده عامل‌های رایانه‌ای با چارچوب متن‌باز OpenCUA
  • 9. دو شیوه اصلی همکاری انسان و عامل

پژوهشگران دانشگاه هنگ‌کنگ (HKU) همراه با چند مؤسسه همکار، چارچوب متن‌باز به نام OpenCUA معرفی کرده‌اند که بستری قدرتمند برای توسعه عامل‌های هوش مصنوعی فراهم می‌کند.

به گزارش تک‌ناک، OpenCUA عامل‌هایی هستند که می‌توانند وظایف مختلف را به‌ صورت مستقل روی رایانه انجام دهند. این چارچوب شامل مجموعه‌ای کامل از ابزارها، داده‌ها و دستورالعمل‌های آموزشی است، که روند توسعه عامل‌های استفاده‌کننده از رایانه (Computer-Use Agents یا CUA) را ساده‌تر و در مقیاس بزرگ‌تر ممکن می‌سازد.

مدل‌هایی که با چارچوب متن‌باز OpenCUA آموزش دیده‌اند، در آزمون‌های معیار عملکرد (CUA Benchmarks) فراتر از مدل‌های متن‌باز دیگر ظاهر شده‌اند و حتی در بسیاری از موارد فاصله خود را با عامل‌های اختصاصی شرکت‌های پیشرویی مانند: OpenAI و Anthropic کاهش داده‌اند.

01
از 09
چالش‌های توسعه عامل‌های رایانه‌ای

عامل‌های CUA به‌گونه‌ای طراحی شده‌اند که بتوانند از کارهایی ساده مانند مرور وب و باز کردن برنامه‌ها گرفته تا کار با نرم‌افزارهای حرفه‌ای و پیچیده را بدون دخالت مستقیم انسان روی رایانه اجرا کنند. این عامل‌ها در محیط‌های سازمانی نیز می‌توانند برای خودکارسازی جریان‌های کاری و افزایش بهره‌وری مورد استفاده قرار گیرند.

اما مشکل اصلی اینجا است که قدرتمندترین نمونه‌های CUA، مدل‌های اختصاصی هستند و جزئیات مهمی مانند داده‌های آموزشی، معماری و روش توسعه آنها کاملاً محرمانه باقی مانده است. همین موضوع باعث شده است که شفافیت کاهش یابد، سرعت پیشرفت فنی محدود شود و نگرانی‌های جدی در حوزه امنیت و اعتمادپذیری به‌وجود آید. پژوهشگران در مقاله خود تأکید کرده‌اند که جامعه علمی به چارچوب‌های کاملاً متن‌باز نیاز دارد تا بتواند قابلیت‌ها، محدودیت‌ها و ریسک‌های این عامل‌ها را مطالعه و بررسی کند.

چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی معرفی شد

02
از 09
معرفی چارچوب متن‌باز OpenCUA

چارچوب OpenCUA دقیقاً برای پاسخ به این چالش‌ها توسعه یافته است. این چارچوب نه تنها به مقیاس‌پذیری داده‌ها توجه دارد، بلکه مدل‌ها را نیز در سطح وسیع‌تری گسترش می‌دهد.

هسته اصلی OpenCUA ابزاری به نام AgentNet Tool است؛ نرم‌افزاری که نمایش‌های انسانی از انجام وظایف رایانه‌ای را ثبت می‌کند. این ابزار روی رایانه شخصی اجرا می‌شود و در پس‌زمینه، ویدیوهای صفحه‌نمایش، ورودی‌های ماوس و صفحه‌کلید، حتی ساختار Accessibility Tree را ضبط می‌کند. داده‌های خام پس از پردازش به «مسیرهای حالت-عمل» تبدیل می‌شوند؛ یعنی هر تصویر صفحه (State) با عمل متناظر کاربر (مانند کلیک یا فشار کلید) جفت می‌شود. در نهایت ثبت‌کنندگان می‌توانند این داده‌ها را بررسی، اصلاح و ارسال کنند.

پژوهشگران با استفاده از همین ابزار، مجموعه‌داده‌ای عظیم به نام AgentNet Dataset گردآوری کردند که بیش از ۲۲,۶۰۰ نمایش وظیفه را در سه سیستم‌عامل ویندوز، macOS و Ubuntu شامل می‌شود. این داده‌ها بیش از ۲۰۰ نرم‌افزار و وب‌سایت را پوشش می‌دهند و پیچیدگی واقعی رفتارهای انسانی و پویایی محیط‌های مختلف را منعکس می‌کنند.

03
از 09
ملاحظات امنیت و حریم خصوصی

از آنجایی‌ که ابزارهای ضبط صفحه می‌توانند نگرانی‌های حریم خصوصی برای سازمان‌ها ایجاد کنند، AgentNet Tool با لایه‌های چندگانه امنیتی طراحی شده است.

  • در مرحله اول، کاربر می‌تواند داده‌های خود را پیش از ارسال به‌طور کامل مشاهده کند.
  • سپس داده‌ها هم به‌ صورت دستی و هم به‌ صورت خودکار توسط یک مدل زبانی بزرگ برای شناسایی اطلاعات حساس بررسی می‌شوند.

به گفته Xinyuan Wang، نویسنده همکار مقاله و دانشجوی دکتری در HKU، این فرایند چندمرحله‌ای باعث می‌شود که داده‌ها حتی در محیط‌های سازمانی حساس مانند داده‌های مشتریان یا مالی نیز قابل اعتماد باشند.

04
از 09
AgentNetBench؛ معیار تازه برای ارزیابی

برای سرعت‌ بخشیدن به ارزیابی عملکرد عامل‌ها، تیم پژوهشی مجموعه‌ای به نام AgentNetBench ایجاد کرده است، که برای هر مرحله چندین عمل درست در نظر می‌گیرد. این کار روشی کارآمدتر برای سنجش عملکرد عامل‌ها فراهم می‌آورد.

05
از 09
دستورالعمل نوین آموزش با چارچوب متن‌باز OpenCUA

چارچوب OpenCUA خط پردازش داده‌ای جدید معرفی کرده، که شامل مراحل زیر است:

  1. تبدیل نمایش‌های انسانی به داده‌های پاک و مناسب برای آموزش مدل‌های بینایی-زبانی (VLM)
  2. افزودن استدلال «زنجیره افکار» (Chain-of-Thought یا CoT) به داده‌ها

استفاده از CoT کلید موفقیت این پروژه بوده است. در این روش برای هر عمل یک «گفتار درونی» ایجاد می‌شود، که شامل مشاهده محیط، تحلیل شرایط، برنامه‌ریزی گام بعدی و در نهایت اقدام عملی است. این ساختار سه‌لایه به عامل‌ها کمک می‌کند درک عمیق‌تری از وظایف پیدا کنند و توانایی تعمیم بیشتری داشته باشند.

این خط پردازش داده به‌گونه‌ای طراحی شده است که سازمان‌ها نیز می‌توانند آن را برای ابزارها و جریان‌های کاری داخلی خود به‌کار گیرند. برای مثال، یک شرکت می‌تواند نمایش‌هایی از فرایندهای اختصاصی خود ضبط کند و با همین روش، داده‌های آموزشی مناسب برای عامل‌های اختصاصی تولید نماید، بدون اینکه نیازی به ایجاد دستی مسیرهای استدلالی باشد.

چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی
چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی

06
از 09
آزمایش و نتایج چارچوب متن‌باز OpenCUA

پژوهشگران این چارچوب را روی مدل‌های متن‌باز مختلف از جمله نسخه‌هایی از Qwen و Kimi-VL در اندازه‌های ۳ تا ۳۲ میلیارد پارامتر آزمایش کردند.

نتیجه برجسته، مدل OpenCUA-32B بود که در آزمون OSWorld-Verified رکورد تازه‌ای میان مدل‌های متن‌باز ثبت کرد. این مدل حتی از CUA مبتنی بر GPT-4o فراتر رفت و فاصله عملکردی خود با مدل‌های اختصاصی Anthropic را به میزان چشمگیری کاهش داد.

07
از 09
یافته‌های کلیدی برای سازمان‌ها

  • روش OpenCUA روی معماری‌های مختلف از جمله Dense و Mixture-of-Experts اثربخش است.
  • عامل‌های آموزش‌دیده توانایی تعمیم بالایی دارند و در وظایف گوناگون و سیستم‌عامل‌های متفاوت، عملکرد قابل قبولی نشان داده‌اند.
  • این چارچوب به‌ویژه برای خودکارسازی وظایف تکراری و زمان‌بر در سازمان‌ها کاربردی است. برای نمونه، در مجموعه‌داده AgentNet حتی نمایش‌هایی از راه‌اندازی سرورهای EC2 در Amazon AWS یا پیکربندی پارامترها در MTurk ثبت شده است.

با وجود این‌، پژوهشگران تأکید کرده‌اند که برای استقرار زنده این عامل‌ها باید چالش‌های مربوط به ایمنی و اعتمادپذیری برطرف شود. چرا که هر خطا ممکن است باعث تغییرات ناخواسته در تنظیمات سیستم یا ایجاد پیامدهای پیش‌بینی‌نشده شود.

08
از 09
آینده عامل‌های رایانه‌ای با چارچوب متن‌باز OpenCUA

کد منبع، مجموعه‌داده و وزن مدل‌های آموزش‌دیده منتشر شده‌اند تا جامعه علمی و صنعتی بتوانند از آنها استفاده کند. پژوهشگران بر این باور هستند که عامل‌های متن‌باز توسعه‌یافته با OpenCUA می‌توانند رابطه میان کاربران و رایانه‌ها را دگرگون کنند.

به‌ اعتقاد آنها، در آینده تسلط بر نرم‌افزارهای پیچیده اهمیت کمتری خواهد داشت و توانایی بیان شفاف هدف برای یک عامل هوش مصنوعی ارزشمندتر خواهد بود.

09
از 09
دو شیوه اصلی همکاری انسان و عامل

  1. اتوماسیون آفلاین: جایی‌ که عامل با تکیه بر دانش نرم‌افزاری خود، وظیفه را به‌ طور کامل اجرا می‌کند.
  2. همکاری آنلاین: جایی‌ که عامل در زمان واقعی کنار کاربر فعالیت می‌کند و مانند یک همکار انسانی، واکنش نشان می‌دهد.

در چنین آینده‌ای، نقش انسان‌ها در تعیین «چه کاری» باقی می‌ماند و عامل‌های هوش مصنوعی روزبه‌روز پیچیده‌تر، مسئولیت «چگونه انجام دادن» را بر عهده خواهند گرفت.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

جایزه امنیتی اپل
امنیت سایبری

نقص امنیتی محصولات اپل را گزارش دهید، ۵ میلیون دلار جایزه بگیرید

نوشته شده توسط اسما کلهر
18 مهر 1404
تحریم تک‌اینسایتس توسط چین
فناوری

چین شرکت کانادایی را تحریم کرد؛ افشای استفاده هواوی از فناوری TSMC با وجود محدودیت‌های آمریکا

نوشته شده توسط اسما کلهر
18 مهر 1404
هوش مصنوعی در اینستاگرام از نگاه آدام موسری
اخبار هوش مصنوعی

هوش مصنوعی در اینستاگرام از نگاه آدام موسری؛ انقلاب خلاقیت دیجیتال

نوشته شده توسط اسما کلهر
18 مهر 1404
تأثیرگذارترین رهبران فناوری ۲۰۲۵
فناوری

رهبران بزرگ فناوری در فهرست ۲۰۲۵ مجله تایم؛ از تسلط بر هوش مصنوعی تا رقابت ژئوپلیتیک تراشه‌ها

نوشته شده توسط امیرحسین یونس
18 مهر 1404
دولینگو و OpenAI
اخبار هوش مصنوعی

دولینگو در صدر فهرست ۳۰ مشتری برتر OpenAI از نظر مصرف توکن قرار گرفت

نوشته شده توسط امیرحسین یونس
18 مهر 1404
خبر بعدی
اپل با انتشار به‌روزرسانی‌های نرم‌افزاری در سپتامبر، ابزارهای تازه‌ای معرفی می‌کند که به شرکت‌ها امکان کنترل دقیق‌تر بر نحوه استفاده کارکنان از هوش مصنوعی را می‌دهد. این تغییرات شامل قابلیت پیکربندی نسخه سازمانی ChatGPT خواهد بود.

گزینه‌های جدید اپل برای پیکربندی ChatGPT در محیط سازمانی

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

آیا پادشاه میم‌کوین‌ها در آستانه جهش است؟

آیا پادشاه میم‌کوین‌ها در آستانه جهش است؟

2 مهر 1404
شیائومی سری Pad 8 را با سیستم‌عامل HyperOS 3 و لوازم جانبی جدید معرفی کرد

شیائومی پد ۸ با رابط کاربری HyperOS 3 و طراحی جدید معرفی شد

26 شهریور 1404 - به‌روزشده در 29 شهریور 1404

داغ‌ترین‌های روز

بهترین ردیاب خودرو ۲۰۲۵

بهترین ردیاب خودرو ۲۰۲۵؛ معرفی ۱۰ مدل برتر بازار

13 مهر 1404 - به‌روزشده در 14 مهر 1404
معرفی بهترین ساعت هوشمند صفحه گرد ۲۰۲۵

معرفی بهترین ساعت هوشمند صفحه گرد ۲۰۲۵

13 مهر 1404
۵ آلت‌کوین برتر برای خرید در اکتبر ۲۰۲۵

۵ آلت‌کوین برتر برای خرید در اکتبر ۲۰۲۵

14 مهر 1404
ریپل

پیش‌بینی قیمت ریپل (XRP) با احتمال ورود ۱۰ میلیارد دلاری سرمایه به ETFها

14 مهر 1404
اروپا از نخستین جنگنده رزمی خودران خود با نام CA-1 Europa رونمایی کرد

اروپا از نخستین جنگنده رزمی خودران خود با نام CA-1 Europa رونمایی کرد

13 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

Aurvana Ace 3 TWS earphones

کریتیو ایرباد بی سیم Aurvana Ace 3 را معرفی کرد

18 مهر 1404
ردمجیک ۱۱ پرو

ردمجیک ۱۱ پرو با اسنپدراگون ۸ نسل ۵ عرضه می‌شود؛ ابرقدرتی که خنک می‌ماند + تصویر

18 مهر 1404
Gigabyte MO32U2 31.5-Inch 4K QD-OLED Display

گیگابایت نمایشگر ۳۱/۵ اینچی با نرخ نوسازی ۲۴۰ هرتز را معرفی کرد

18 مهر 1404
قابلیت لغو خودکار اعلان‌ها در کروم

خداحافظی کروم با اعلان‌های آزاردهنده؛ نوتیف‌های مزاحم غیرفعال می‌شوند

18 مهر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir