• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

معرفی چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 1 شهریور 1404 - 12:40
در اخبار هوش مصنوعی, فناوری
معرفی چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهشگران دانشگاه هنگ‌کنگ (HKU) همراه با چند مؤسسه همکار، چارچوب متن‌باز به نام OpenCUA معرفی کرده‌اند که بستری قدرتمند برای توسعه عامل‌های هوش مصنوعی فراهم می‌کند.

به گزارش تک‌ناک، OpenCUA عامل‌هایی هستند که می‌توانند وظایف مختلف را به‌ صورت مستقل روی رایانه انجام دهند. این چارچوب شامل مجموعه‌ای کامل از ابزارها، داده‌ها و دستورالعمل‌های آموزشی است، که روند توسعه عامل‌های استفاده‌کننده از رایانه (Computer-Use Agents یا CUA) را ساده‌تر و در مقیاس بزرگ‌تر ممکن می‌سازد.

مدل‌هایی که با چارچوب متن‌باز OpenCUA آموزش دیده‌اند، در آزمون‌های معیار عملکرد (CUA Benchmarks) فراتر از مدل‌های متن‌باز دیگر ظاهر شده‌اند و حتی در بسیاری از موارد فاصله خود را با عامل‌های اختصاصی شرکت‌های پیشرویی مانند: OpenAI و Anthropic کاهش داده‌اند.

فهرست مطالب

  • چالش‌های توسعه عامل‌های رایانه‌ای
  • معرفی چارچوب متن‌باز OpenCUA
  • ملاحظات امنیت و حریم خصوصی
  • AgentNetBench؛ معیار تازه برای ارزیابی
  • دستورالعمل نوین آموزش با چارچوب متن‌باز OpenCUA
  • آزمایش و نتایج چارچوب متن‌باز OpenCUA
  • یافته‌های کلیدی برای سازمان‌ها
  • آینده عامل‌های رایانه‌ای با چارچوب متن‌باز OpenCUA
  • دو شیوه اصلی همکاری انسان و عامل

چالش‌های توسعه عامل‌های رایانه‌ای

عامل‌های CUA به‌گونه‌ای طراحی شده‌اند که بتوانند از کارهایی ساده مانند مرور وب و باز کردن برنامه‌ها گرفته تا کار با نرم‌افزارهای حرفه‌ای و پیچیده را بدون دخالت مستقیم انسان روی رایانه اجرا کنند. این عامل‌ها در محیط‌های سازمانی نیز می‌توانند برای خودکارسازی جریان‌های کاری و افزایش بهره‌وری مورد استفاده قرار گیرند.

اما مشکل اصلی اینجا است که قدرتمندترین نمونه‌های CUA، مدل‌های اختصاصی هستند و جزئیات مهمی مانند داده‌های آموزشی، معماری و روش توسعه آنها کاملاً محرمانه باقی مانده است. همین موضوع باعث شده است که شفافیت کاهش یابد، سرعت پیشرفت فنی محدود شود و نگرانی‌های جدی در حوزه امنیت و اعتمادپذیری به‌وجود آید. پژوهشگران در مقاله خود تأکید کرده‌اند که جامعه علمی به چارچوب‌های کاملاً متن‌باز نیاز دارد تا بتواند قابلیت‌ها، محدودیت‌ها و ریسک‌های این عامل‌ها را مطالعه و بررسی کند.

چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی معرفی شد

معرفی چارچوب متن‌باز OpenCUA

چارچوب OpenCUA دقیقاً برای پاسخ به این چالش‌ها توسعه یافته است. این چارچوب نه تنها به مقیاس‌پذیری داده‌ها توجه دارد، بلکه مدل‌ها را نیز در سطح وسیع‌تری گسترش می‌دهد.

هسته اصلی OpenCUA ابزاری به نام AgentNet Tool است؛ نرم‌افزاری که نمایش‌های انسانی از انجام وظایف رایانه‌ای را ثبت می‌کند. این ابزار روی رایانه شخصی اجرا می‌شود و در پس‌زمینه، ویدیوهای صفحه‌نمایش، ورودی‌های ماوس و صفحه‌کلید، حتی ساختار Accessibility Tree را ضبط می‌کند. داده‌های خام پس از پردازش به «مسیرهای حالت-عمل» تبدیل می‌شوند؛ یعنی هر تصویر صفحه (State) با عمل متناظر کاربر (مانند کلیک یا فشار کلید) جفت می‌شود. در نهایت ثبت‌کنندگان می‌توانند این داده‌ها را بررسی، اصلاح و ارسال کنند.

پژوهشگران با استفاده از همین ابزار، مجموعه‌داده‌ای عظیم به نام AgentNet Dataset گردآوری کردند که بیش از ۲۲,۶۰۰ نمایش وظیفه را در سه سیستم‌عامل ویندوز، macOS و Ubuntu شامل می‌شود. این داده‌ها بیش از ۲۰۰ نرم‌افزار و وب‌سایت را پوشش می‌دهند و پیچیدگی واقعی رفتارهای انسانی و پویایی محیط‌های مختلف را منعکس می‌کنند.

ملاحظات امنیت و حریم خصوصی

از آنجایی‌ که ابزارهای ضبط صفحه می‌توانند نگرانی‌های حریم خصوصی برای سازمان‌ها ایجاد کنند، AgentNet Tool با لایه‌های چندگانه امنیتی طراحی شده است.

  • در مرحله اول، کاربر می‌تواند داده‌های خود را پیش از ارسال به‌طور کامل مشاهده کند.
  • سپس داده‌ها هم به‌ صورت دستی و هم به‌ صورت خودکار توسط یک مدل زبانی بزرگ برای شناسایی اطلاعات حساس بررسی می‌شوند.

به گفته Xinyuan Wang، نویسنده همکار مقاله و دانشجوی دکتری در HKU، این فرایند چندمرحله‌ای باعث می‌شود که داده‌ها حتی در محیط‌های سازمانی حساس مانند داده‌های مشتریان یا مالی نیز قابل اعتماد باشند.

AgentNetBench؛ معیار تازه برای ارزیابی

برای سرعت‌ بخشیدن به ارزیابی عملکرد عامل‌ها، تیم پژوهشی مجموعه‌ای به نام AgentNetBench ایجاد کرده است، که برای هر مرحله چندین عمل درست در نظر می‌گیرد. این کار روشی کارآمدتر برای سنجش عملکرد عامل‌ها فراهم می‌آورد.

دستورالعمل نوین آموزش با چارچوب متن‌باز OpenCUA

چارچوب OpenCUA خط پردازش داده‌ای جدید معرفی کرده، که شامل مراحل زیر است:

  1. تبدیل نمایش‌های انسانی به داده‌های پاک و مناسب برای آموزش مدل‌های بینایی-زبانی (VLM)
  2. افزودن استدلال «زنجیره افکار» (Chain-of-Thought یا CoT) به داده‌ها

استفاده از CoT کلید موفقیت این پروژه بوده است. در این روش برای هر عمل یک «گفتار درونی» ایجاد می‌شود، که شامل مشاهده محیط، تحلیل شرایط، برنامه‌ریزی گام بعدی و در نهایت اقدام عملی است. این ساختار سه‌لایه به عامل‌ها کمک می‌کند درک عمیق‌تری از وظایف پیدا کنند و توانایی تعمیم بیشتری داشته باشند.

این خط پردازش داده به‌گونه‌ای طراحی شده است که سازمان‌ها نیز می‌توانند آن را برای ابزارها و جریان‌های کاری داخلی خود به‌کار گیرند. برای مثال، یک شرکت می‌تواند نمایش‌هایی از فرایندهای اختصاصی خود ضبط کند و با همین روش، داده‌های آموزشی مناسب برای عامل‌های اختصاصی تولید نماید، بدون اینکه نیازی به ایجاد دستی مسیرهای استدلالی باشد.

چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی
چارچوب متن‌باز OpenCUA برای توسعه عامل‌های هوش مصنوعی

آزمایش و نتایج چارچوب متن‌باز OpenCUA

پژوهشگران این چارچوب را روی مدل‌های متن‌باز مختلف از جمله نسخه‌هایی از Qwen و Kimi-VL در اندازه‌های ۳ تا ۳۲ میلیارد پارامتر آزمایش کردند.

نتیجه برجسته، مدل OpenCUA-32B بود که در آزمون OSWorld-Verified رکورد تازه‌ای میان مدل‌های متن‌باز ثبت کرد. این مدل حتی از CUA مبتنی بر GPT-4o فراتر رفت و فاصله عملکردی خود با مدل‌های اختصاصی Anthropic را به میزان چشمگیری کاهش داد.

یافته‌های کلیدی برای سازمان‌ها

  • روش OpenCUA روی معماری‌های مختلف از جمله Dense و Mixture-of-Experts اثربخش است.
  • عامل‌های آموزش‌دیده توانایی تعمیم بالایی دارند و در وظایف گوناگون و سیستم‌عامل‌های متفاوت، عملکرد قابل قبولی نشان داده‌اند.
  • این چارچوب به‌ویژه برای خودکارسازی وظایف تکراری و زمان‌بر در سازمان‌ها کاربردی است. برای نمونه، در مجموعه‌داده AgentNet حتی نمایش‌هایی از راه‌اندازی سرورهای EC2 در Amazon AWS یا پیکربندی پارامترها در MTurk ثبت شده است.

با وجود این‌، پژوهشگران تأکید کرده‌اند که برای استقرار زنده این عامل‌ها باید چالش‌های مربوط به ایمنی و اعتمادپذیری برطرف شود. چرا که هر خطا ممکن است باعث تغییرات ناخواسته در تنظیمات سیستم یا ایجاد پیامدهای پیش‌بینی‌نشده شود.

آینده عامل‌های رایانه‌ای با چارچوب متن‌باز OpenCUA

کد منبع، مجموعه‌داده و وزن مدل‌های آموزش‌دیده منتشر شده‌اند تا جامعه علمی و صنعتی بتوانند از آنها استفاده کند. پژوهشگران بر این باور هستند که عامل‌های متن‌باز توسعه‌یافته با OpenCUA می‌توانند رابطه میان کاربران و رایانه‌ها را دگرگون کنند.

به‌ اعتقاد آنها، در آینده تسلط بر نرم‌افزارهای پیچیده اهمیت کمتری خواهد داشت و توانایی بیان شفاف هدف برای یک عامل هوش مصنوعی ارزشمندتر خواهد بود.

دو شیوه اصلی همکاری انسان و عامل

  1. اتوماسیون آفلاین: جایی‌ که عامل با تکیه بر دانش نرم‌افزاری خود، وظیفه را به‌ طور کامل اجرا می‌کند.
  2. همکاری آنلاین: جایی‌ که عامل در زمان واقعی کنار کاربر فعالیت می‌کند و مانند یک همکار انسانی، واکنش نشان می‌دهد.

در چنین آینده‌ای، نقش انسان‌ها در تعیین «چه کاری» باقی می‌ماند و عامل‌های هوش مصنوعی روزبه‌روز پیچیده‌تر، مسئولیت «چگونه انجام دادن» را بر عهده خواهند گرفت.

سید محمد برازنده

سید محمد برازنده

مطالب مرتبط

روان‌پریشی ChatGPT
اخبار هوش مصنوعی

چت‌بات ChatGPT کاربر آمریکایی را تا مرز فروپاشی روانی کشاند

نوشته شده توسط اسما کلهر
1 شهریور 1404
پروتز مغزی خواندن افکار به متن
فناوری

نخستین دستگاه مغزی برای خواندن گفتار درونی معرفی شد

نوشته شده توسط اسما کلهر
1 شهریور 1404
هند موشک هسته‌ای Agni-5 با برد ۵۰۰۰ کیلومتر را با موفقیت آزمایش کرد
پیشنهاد سردبیر

هند موشک هسته‌ای Agni-5 با برد ۵۰۰۰ کیلومتر را با موفقیت آزمایش کرد

نوشته شده توسط نرگس چالوک
1 شهریور 1404
اپل در حال مذاکره با گوگل برای به‌کارگیری مدل هوش مصنوعی Gemini در نسخه جدید دستیار صوتی سیری است. این اقدام پس از گفت‌وگوهای مشابه با شرکت‌های OpenAI و Anthropic صورت می‌گیرد.
اخبار هوش مصنوعی

همکاری اپل و گوگل برای استفاده از مدل Gemini در سیری

نوشته شده توسط سید محمد برازنده
1 شهریور 1404
ورود هوندا به صنعت هوانوردی با جت‌های سبک Elite II
فناوری

ورود هوندا به صنعت هوانوردی با جت‌های سبک Elite II

نوشته شده توسط نرگس چالوک
1 شهریور 1404
خبر بعدی
اپل با انتشار به‌روزرسانی‌های نرم‌افزاری در سپتامبر، ابزارهای تازه‌ای معرفی می‌کند که به شرکت‌ها امکان کنترل دقیق‌تر بر نحوه استفاده کارکنان از هوش مصنوعی را می‌دهد. این تغییرات شامل قابلیت پیکربندی نسخه سازمانی ChatGPT خواهد بود.

گزینه‌های جدید اپل برای پیکربندی ChatGPT در محیط سازمانی

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

پایان پشتیبانی ویز از نسخه‌های قدیمی اندروید

ویز دیگر با نسخه‌های قدیمی اندروید سازگار نیست

20 مرداد 1404
تشخیص یک بیماری مرگبار در نیم ساعت؛ معجزه یک نخبه ایرانی

تشخیص یک بیماری مرگبار در نیم ساعت؛ معجزه یک نخبه ایرانی

6 مرداد 1404

داغ‌ترین‌های روز

گوشی پوکو M7 نسخه 4G با باتری ۷۰۰۰ میلی‌آمپری معرفی شد

گوشی پوکو M7 نسخه 4G با باتری 7000 میلی‌آمپری معرفی شد

26 مرداد 1404
این گوشی های سامسونگ در ماه آینده آپدیت بتای One UI 8 را دریافت می‌کنند

این گوشی‌های سامسونگ ماه آینده آپدیت بتای One UI 8 را دریافت می‌کنند

28 مرداد 1404
بهترین پاوربانک های فست شارژ (راهنمای خرید ۱۴۰۴)

بهترین پاوربانک های فست شارژ (راهنمای خرید ۱۴۰۴)

31 مرداد 1404
محرومیت گوشی‌های شیائومی از HyperOS 3

پایان پشتیبانی از گوشی‌های محبوب شیائومی؛ این مدل‌ها HyperOS 3 را دریافت نمی‌کنند

29 مرداد 1404
بهترین گوشی گیمینگ شیائومی در بازار ایران [۱۴۰۴]

بهترین گوشی گیمینگ شیائومی در بازار ایران (1404)

26 مرداد 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

معرفی هشت ویژگی تازه در اپل موزیک با انتشار iOS 26

معرفی ویژگی‌های جدید اپل موزیک با انتشار iOS 26

1 شهریور 1404
افت کیفیت باتری پیکسل ۱۰ پس از ۲۰۰ چرخه شارژ به‌دلیل قابلیت جدید گوگل

افت کیفیت باتری پیکسل ۱۰ پس‌از ۲۰۰ چرخه شارژ به‌دلیل قابلیت جدید گوگل

1 شهریور 1404
پرونده حقوقی OpenAI علیه ماسک

درخواست OpenAI برای بررسی نقش متا در پیشنهاد ۹۷ میلیارد دلاری ایلان ماسک

1 شهریور 1404
پلی‌استیشن نخستین مجموعه بازی‌های پروژه MENA Hero Project را معرفی کرد

پلی‌استیشن نخستین مجموعه بازی‌های MENA Hero Project را معرفی کرد

1 شهریور 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir