No Result

مشاهده تمامی نتایج

No Result

مشاهده تمامی نتایج

تک ناک » فناوری » اخبار هوش مصنوعی » مدل Fara-7B مایکروسافت با وظایف پیچیده رونمایی شد + ویدیو

مدل Fara-7B مایکروسافت با وظایف پیچیده رونمایی شد + ویدیو

نوشته شده توسط سید محمد برازنده

چهارشنبه 5 آذر 1404 - 12:00

در اخبار هوش مصنوعی, فناوری

مدل Fara-7B مایکروسافت با وظایف پیچیده رونمایی شد

شرکت مایکروسافت از مدل کوچک اما کارآمد Fara-7B برای اجرای وظایف پیچیده به‌ صورت محلی رونمایی کرد.

به گزارش سرویس فناوری تک‌ناک، این مدل با ۷ میلیارد پارامتر به‌ عنوان یک Computer Use Agent (CUA) طراحی شده است. مدل Fara-7B برای اندازه خود رکورد جدیدی از کارایی ایجاد می‌کند و امکان ساخت ایجنت‌هایی را فراهم می‌سازد که به مدل‌های عظیم و ابری وابسته نیستند و می‌توانند روی سیستم‌های جمع‌وجور با تأخیر کمتر و حفظ حریم خصوصی بیشتر اجرا شوند.

این مدل اگرچه نسخه‌ای آزمایشی است، اما معماری آن یکی از موانع اصلی پذیرش سازمانی یعنی امنیت داده را هدف قرار می‌دهد، چرا که Fara-7B اندازه‌ای کوچک دارد و می‌تواند به‌ صورت محلی اجرا شود، کاربران قادر می‌شوند گردش‌کارهای حساس مانند مدیریت حساب‌های داخلی یا پردازش داده‌های محرمانه را بدون خروج اطلاعات از دستگاه خود خودکار کنند.

01
از 05
مدل Fara-7B مایکروسافت چگونه وب را می‌بیند

این مدل با همان ابزارهایی که انسان استفاده می‌کند، یعنی ماوس و صفحه‌کلید، رابط‌های کاربری را پیمایش می‌کند. مدل با مشاهده تصویری صفحات وب از طریق اسکرین‌شات‌ها، مختصات دقیق را برای اقداماتی مانند کلیک‌ کردن، تایپ‌ کردن و اسکرول‌ کردن پیش‌بینی می‌کند.

این مدل برخلاف بسیاری از سیستم‌ها به accessibility trees متکی نیست؛ ساختارهایی که مرورگرها برای توصیف صفحات وب به خوانشگرهای صفحه استفاده می‌کنند. در عوض، Fara-7B تنها به داده بصری در سطح پیکسل تکیه می‌کند. این روش ایجنت را قادر می‌سازد در سایت‌هایی با کد پیچیده یا مبهم نیز تعامل دقیقی داشته باشد.

بخوانید: مایکروسافت قابلیت ازسرگیری فعالیت موبایل روی رایانه را به نوار وظیفه ویندوز ۱۱ آورد + تصویر

به‌ گفته Yash Lara، مدیر ارشد محصول در مایکروسافت ریسرچ، پردازش همه ورودی‌های بصری روی دستگاه، نوعی «حاکمیت پیکسلی» ایجاد می‌کند، چرا که اسکرین‌شات‌ها و فرایند استدلالی ایجنت هرگز از دستگاه خارج نمی‌شود. او توضیح داد که این رویکرد به سازمان‌ها امکان می‌دهد به الزامات سختگیرانه حوزه‌های قانون‌گذاری‌شده مانند HIPAA و GLBA پایبند بمانند.

مدل Fara-7B مایکروسافت رونمایی شد

در آزمون‌های بنچمارک، این رویکرد تصویری عملکرد چشمگیری ایجاد کرده است. در WebVoyager، یکی از بنچمارک‌های استاندارد ایجنت‌های وب، Fara-7B موفق شد به نرخ موفقیت ۷۳.۵ درصد برسد؛ رقمی که از سیستم‌های بزرگ‌تر مانند GPT-4o در حالت CUA و مدل UI-TARS-1.5-7B نیز بهتر است.

02
از 05
کارایی و سرعت مدل Fara-7B مایکروسافت

مدل Fara-7B در مقایسه‌ها تنها در حدود ۱۶ مرحله یک وظیفه را کامل کرده است، در حالی که مدل UI-TARS-1.5 به حدود ۴۱ مرحله نیاز داشته است. این موضوع نشان می‌دهد که این مدل در عین کوچک بودن، از لحاظ کارایی بهینه است.

رونمایی از مدل Fara-7B مایکروسافت با وظایف پیچیده

03
از 05
مدیریت ریسک‌ها

شرکت مایکروسافت هشدار می‌دهد که Fara-7B نیز مانند دیگر مدل‌ها ممکن است دچار خطا، توهم یا کاهش دقت در وظایف پیچیده شود. برای کاهش این ریسک‌ها، مدل به‌گونه‌ای آموزش دیده است تا Critical Points را تشخیص دهد؛ نقاطی که انجام یک اقدام غیرقابل بازگشت مانند ارسال ایمیل یا تأیید تراکنش مالی نیازمند تأیید کاربر است. ایجنت در چنین لحظاتی مکث می‌کند و اجازه کاربر را درخواست می‌کند.

به‌ گفته Lara، حفظ تعادل میان این نقاط حساس و تجربه کاربری روان یک چالش کلیدی است و وجود رابط‌هایی مانند Magentic-UI برای مداخله کاربر ضروری می‌باشد.

برای مطالعه بیشتر: ۴۰ سال از انتشار ویندوز ۱/۰۱ گذشت؛ آغازی ناموفق برای امپراتوری مایکروسافت

04
از 05
فشرده‌سازی پیچیدگی در یک مدل کوچک

توسعه مدل Fara-7B بخشی از روند رو به رشد دانش‌تقطیر مایکروسافت است؛ جایی که توانایی‌های سیستم‌های بزرگ در مدلی کوچک و کارآمد فشرده می‌شود. مایکروسافت برای جمع‌آوری داده آموزشی به‌جای اتکا به داده پرهزینه انسانی، از یک خط داده مصنوعی مبتنی بر Magentic-One استفاده کرده است. در این سیستم چندایجنتی، یک Orchestrator برنامه‌ریزی می‌کرد و یک WebSurfer وظایف را در وب انجام می‌داد و ۱۴۵ هزار مسیر موفقیت‌آمیز تولید می‌شد.

سپس این داده‌ها در یک مدل تکی یعنی Fara-7B قرار گرفت؛ مدلی که بر پایه Qwen2.5-VL-7B ساخته شده است و از پنجره متنی بزرگ ۱۲۸ هزار توکنی و قابلیت اتصال قوی متن و تصویر بهره می‌برد.

هوش کوچک، وب را با چشمان پیکسلی می‌گرداند

05
از 05
چشم‌انداز آینده

نسخه فعلی بر داده ثابت تکیه دارد، اما نسخه‌های آینده به جای بزرگ‌تر شدن بر «هوشمندتر شدن» تمرکز دارند. مایکروسافت قصد دارد با روش‌هایی مثل یادگیری تقویتی در محیط‌های ایزوله، رفتار ایجنت را به‌صورت زنده ارتقا دهد.

این مدل اکنون در Hugging Face و Microsoft Foundry با مجوز MIT عرضه شده است، اما Lara هشدار می‌دهد که Fara-7B هنوز آماده محیط‌های حساس عملیاتی نیست و بیشتر برای آزمایش و نمونه‌سازی اولیه مناسب است.

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

دستگاه پایش قند خون Isaac در کنار پایه شارژ و اپلیکیشن موبایل مربوطه که نمودار سطح گلوکز را نشان می‌دهد.

پایش قند خون با بازدم؛ کلید ورود فناوری «گلوکومتر» به اپل‌واچ

نوشته شده توسط اسما کلهر

یک توالت فرنگی مجهز به سنسور هوشمند پایش سلامت نصب شده بر روی لبه کاسه.

مرز میان نبوغ و دیوانگی؛ نگاهی به عجیب‌ترین و جنجالی‌ترین گجت‌های نمایشگاه CES 2026

نوشته شده توسط اسما کلهر

نمای نزدیک از داخل یک حلقه هوشمند سامسونگ (Galaxy Ring) که دچار تورم باتری و تغییر شکل بدنه شده است.

پایان تحقیقات سامسونگ در پرونده جنجالی گلکسی رینگ؛ نقص فنی در بدنه، نه انفجار باتری!

نوشته شده توسط اسما کلهر

نمای رابط کاربری Gmail با قابلیت AI Overview که جستجوی زبان طبیعی در صندوق ورودی را نمایش می‌دهد؛ پرسش متنی درباره دریافت قیمت بازسازی حمام در نوار جستجو وارد شده و خلاصه هوشمند شامل تعداد پیشنهادها، نام شرکت‌ها، شماره پیش‌فاکتور، مبالغ دلاری و تاریخ ارسال ایمیل‌ها به‌صورت ساختاریافته نمایش داده شده است.

اخبار هوش مصنوعی

جیمیل با تمرکز گسترده بر هوش مصنوعی جمنای بازطراحی می‌شود

نوشته شده توسط تارخ ترهنده

آیکون پازل رنگی گوگل پلی روی صفحه نمایش یک گوشی هوشمند.

نقشه راه گوگل برای سال ۲۰۲۶؛ انتشار جزئیات به‌روزرسانی بزرگ سیستم گوگل در ژانویه

نوشته شده توسط امیرحسین یونس

خبر بعدی

رابط کاربری جدید شیائومی روی گوشی‌ها

شیائومی عرضه جهانی HyperOS 3 را رفته رفته تکمیل می‌ کند

دیدگاهتان را بنویسید لغو پاسخ

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

عینک هوشمند IXI با فریم مشکی و پل نیمه‌شفاف که اجزای داخلی و مدارهای الکترونیکی آن قابل مشاهده است.

این عینک هوشمند نمره چشمتان را تغییر می‌دهد

18 دی 1404

نمای پانوراما از خط افق شهر شانگهای چین در هنگام غروب با ساختمان‌های بلند و بزرگراه‌های پرنور زیر لایه‌ای از مه.

هر جعبه‌ ۱۰۰ تایی حافظه DDR5 به قیمت ملک در شانگهای رسید

18 دی 1404

دستگاه پایش قند خون Isaac در کنار پایه شارژ و اپلیکیشن موبایل مربوطه که نمودار سطح گلوکز را نشان می‌دهد.

پایش قند خون با بازدم؛ کلید ورود فناوری «گلوکومتر» به اپل‌واچ

18 دی 1404

مقایسه رابط کاربری و ویجت‌های یک آی‌پد در کنار یک آیفون که نشان‌دهنده شباهت‌های نرم‌افزاری احتمالی برای آیفون تاشو است.

آیفون فولد یا آیپد جیبی؟؛ افشاگری‌های جدید از استراتژی متفاوت اپل در بازار گوشی‌های تاشو

18 دی 1404

دسترسی سریع

© Copyright 2025 Technoc.ir

No Result

مشاهده تمامی نتایج

© Copyright 2025 Technoc.ir