• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » دسته‌بندی نشده » Ferret-UI Lite اپل با ۳ میلیارد پارامتر، عملکردی در حد مدل‌های ۲۴ برابر بزرگ‌تر ارائه می‌دهد

Ferret-UI Lite اپل با ۳ میلیارد پارامتر، عملکردی در حد مدل‌های ۲۴ برابر بزرگ‌تر ارائه می‌دهد

امیرحسین یونس نوشته شده توسط امیرحسین یونس
شنبه 2 اسفند 1404 - 19:20
در اخبار هوش مصنوعی, فناوری
تصویری گرافیکی از چهار ربات سفید کوچک شبیه به هم که به ردیف پشت میز نشسته و با لپ‌تاپ‌های آبی کار می‌کنند.
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

اپل با مدل چندوجهی Ferret-UI Lite و بهره‌گیری از شیوه‌های پیشرفته تولید داده مصنوعی عملکردی هم‌سطح مدل‌های GUI تا ۲۴ برابر بزرگ‌تر ارائه داد.

به گزارش سرویس هوش مصنوعی تک‌ناک، در پیشرفتی چشمگیر برای هوش مصنوعی روی دستگاه (on-device AI)، پژوهشگران اپل مدل جدیدی به نام Ferret-UI Lite را معرفی کرده‌اند که با وجود تنها ۳ میلیارد پارامتر، در بنچمارک‌های مهم عملکردی مشابه یا حتی بهتر از مدل‌های رقیب از خود نشان می‌دهد که تا ۲۴ برابر بزرگ‌تر هستند. این دستاورد می‌تواند راه را برای عامل‌های رابط کاربری (GUI agents) هوشمندتر و خصوصی‌تر و کارآمدتر بر روی دستگاه‌های شخصی هموار کند.

داستان Ferret در دسامبر ۲۰۲۳ آغاز شد؛ زمانی که تیمی نُه‌نفره از پژوهشگران مقاله‌ای با عنوان «FERRET؛ ارجاع و زمینه‌یابی هر چیزی، هرجا، با هر دانه‌بندی» منتشر کردند. این مطالعه مدل زبان بزرگ چندوجهی (MLLM) را معرفی کرد که می‌تواند ارجاعات زبان طبیعی به بخش‌های خاصی از یک تصویر را درک کند.

پس‌از آن، اپل مدل‌های سری Ferret را با نسخه‌هایی مانند Ferretv2 و Ferret-UI و Ferret-UI 2 گسترش داد. به‌طور خاص، مدل‌های Ferret-UI بر قابلیت‌های اصلی Ferret افزودند و برای غلبه بر کاستی‌های مدل‌های MLLM عمومی در درک و تعامل با نمایشگرهای رابط کاربری (UI) آموزش دیدند.

پژوهشگران در مقاله اصلی Ferret-UI اشاره کردند: «این MLLMهای عمومی اغلب در توانایی خود برای درک و تعامل مؤثر با نمایشگرهای رابط کاربری (UI) کوتاهی می‌کنند.» Ferret-UI با قابلیت هر رزولوشنی خود، توانایی بزرگ‌نمایی جزئیات کوچک رابط کاربری را داشت.

نمودار آموزشی مدل Ferret که شامل جفت‌شدن تصاویر (حیوانات و آماده‌سازی غذا) با چت‌های متنی و کادرهای مشخص‌کننده اشیاء است.

Ferret-UI اصلی روی مدلی ۱۳ میلیارد پارامتری ساخته شده بود که عمدتاً بر درک رابط کاربری موبایل متمرکز بود؛ در‌حالی‌که Ferret-UI 2 این سیستم را به پلتفرم‌های متعدد و درک با رزولوشن بیشتر گسترش داد. بااین‌حال Ferret-UI Lite، جدیدترین عضو این سری، رویکرد متفاوتی در پیش گرفته است. مدل مذکور نسخه‌ای بسیار سبک‌تر با ۳ میلیارد پارامتر است که برای اجرای مستقیم روی دستگاه طراحی شده است؛ درحالی‌که همچنان می‌تواند با عامل‌های رابط گرافیکی (GUI) بزرگ‌تر رقابت کند.

پژوهشگران در مقاله جدید خود با عنوان «Ferret-UI Lite؛ درس‌هایی از ساخت عامل‌های GUI کوچک روی دستگاه»، به این نکته اشاره می‌کنند که اکثر عامل‌های رابط گرافیکی (GUI) موجود بر مدل‌های پایه بزرگ و سمت سرور متکی هستند. این مدل‌های بزرگ قابلیت‌های استدلال و برنامه‌ریزی قدرتمندی دارند؛ اما برای اجرا روی دستگاه بیش‌از‌حد سنگین و نیازمند محاسبات پیچیده هستند.

رابط کاربری یک گوشی هوشمند که قابلیت‌های مدل Ferret-UI را در شناسایی ویجت‌ها، آیکون‌ها و پاسخ به سوالات مربوط به صفحه نمایش نشان می‌دهد.

Ferret-UI Lite با بهره‌گیری از داده‌های آموزشی واقعی و مصنوعی از دامنه‌های مختلف رابط گرافیکی (GUI)، شیوه‌های برش و بزرگ‌نمایی در لحظه یا زمان استنتاج و تکنیک‌های تنظیم دقیق نظارت‌شده و یادگیری تقویتی، این مشکل را برطرف می‌کند. شیوه‌های برش و بزرگ‌نمایی به مدل کوچک کمک می‌کنند تا با انجام پیش‌بینی اولیه و برش‌دادن ناحیه مربوتبط و سپس پیش‌بینی مجدد در ناحیه بزرگ‌نمایی‌شده، ظرفیت محدود خود را برای پردازش تعداد زیادی توکن تصویر جبران کند.

یکی از مشارکت‌های مهم این مقاله روشی است که Ferret-UI Lite داده‌های آموزشی خود را تولید می‌کند. پژوهشگران سیستمی چندعاملی ساخته‌اند که مستقیماً با پلتفرم‌های رابط گرافیکی (GUI) زنده تعامل می‌کند تا مثال‌های آموزشی مصنوعی را در مقیاس وسیع تولید کند. این سیستم شامل مولد وظایف، عامل برنامه‌ریز، عامل زمینه‌یاب و مدل منتقد است که با همکاری یکدیگر، ابهام تعامل‌های دنیای واقعی مانند خطاها و حالت‌های غیرمنتظره را ثبت و داده‌های آموزشی غنی و واقع‌گرایانه تولید می‌کنند

اینفوگرافیک مدل Ferret-UI Lite که فرآیند «مشاهده، تفکر، برنامه‌ریزی و اجرا» را برای انجام یک وظیفه در محیط دسکتاپ نمایش می‌دهد.

نکته جالب این است که Ferret-UI Lite برخلاف Ferret-UI و Ferret-UI 2 که بر رابط‌های کاربری اپل متمرکز بودند، روی محیط‌های رابط گرافیکی (GUI) اندروید و وب و دسکتاپ آموزش دیده و ارزیابی شده است و از بنچمارک‌هایی مانند AndroidWorld و OSWorld بهره می‌برد. این انتخاب احتمالاً به‌دلیل در‌دسترس‌بودن بسترهای آزمایشی عامل رابط گرافیکی (GUI) در مقیاس بزرگ و با قابلیت بازتولید در این پلتفرم‌ها است.

9to5mac می‌نویسد که پژوهشگران اذعان می‌کنند Ferret-UI Lite اپل در وظایف کوتاه‌مدت و سطح پایین عملکرد درخشانی از خود نشان داده؛ اما در تعامل‌های پیچیده‌تر و چند‌مرحله‌ای به همان اندازه قوی عمل نکرده است که با توجه به محدودیت‌های مدل کوچک روی دستگاه قابل انتظار است.

با‌این‌حال، اهمیت این مدل در توانایی آن برای ارائه عامل محلی و خصوصی است که به‌طور مستقل با رابط‌های کاربری برنامه‌ها براساس درخواست‌های کاربر تعامل می‌کند، بدون نیاز به ارسال داده‌ها به فضای ابری و پردازش روی سرورهای راه دور. این قابلیت حریم خصوصی و امنیت کاربر را افزایش می‌دهد و دریچه‌ای نو به‌سوی آینده هوش مصنوعی در دستگاه‌های شخصی می‌گشاید.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

یک تصویر گرافیکی مدرن و انتزاعی از لوگوی یوتیوب. کلمه YouTube با فونت سفید روی یک کادر قرمز بزرگ و منحنی قرار گرفته است. در پس‌زمینه، اشکال هندسی نامنظم به رنگ‌های قرمز، سیاه و سفید دیده می‌شوند که حسی از پویایی و رسانه‌های دیجیتال را منتقل می‌کنند
شبکه های اجتماعی

یوتیوب پیام‌رسانی خصوصی را دوباره فعال کرد

نوشته شده توسط تارخ ترهنده
21 خرداد 1405
نمای نزدیک از یک استابلایزر و گیمبال گوشی هوشمند مشکی رنگ که روی یک سنگ در دشت گل‌های زرد قرار دارد. در پس‌زمینه، کوه‌های پوشیده از برف زیر آسمان آبی دیده می‌شوند. صفحه نمایش کوچک روی دسته‌ی گیمبال، تصویر منظره را نشان می‌دهد
دوربین دیجیتال

دوربین گیمبال Luna Ultra اینستا با سنسور 8K وارد بازار شد

نوشته شده توسط تارخ ترهنده
21 خرداد 1405
دستیار هوش مصنوعی جمینای برای مشاغل
اخبار هوش مصنوعی

جمینای به ابزار مدیریت کسب‌وکار مجهز شد

نوشته شده توسط سید محمد برازنده
21 خرداد 1405
هوش مصنوعی برای وکلا
اخبار هوش مصنوعی

دادگاه آمریکا به وکلایی که از هوش مصنوعی استفاده می‌کنند هشدار جدی داد

نوشته شده توسط مانی
21 خرداد 1405
نمای نزدیک از دست یک ربات انسان‌نما با انگشتان مفصلی پیشرفته که برای تقلید حرکات ظریف دست انسان طراحی شده است.
رباتیک

این مچ‌بند اولتراسوند حرکات عضلات دست را به زبان ربات‌ها ترجمه می‌کند

نوشته شده توسط نرگس چالوک
21 خرداد 1405
خبر بعدی
نمای گرافیکی از دو باتری بزرگ با ظرفیت‌های 8000mAh و 8500mAh که بر روی بدنه داخلی یک گوشی هوشمند قرار گرفته‌اند.

پایان کابوس شارژ گوشی؛ قدرت‌نمایی باتری ۸,۵۰۰ میلی‌آمپرساعتی شیائومی

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

ابر اپلیکیشن ChatGPT در راه است

ابر اپلیکیشن ChatGPT در راه است

18 خرداد 1405
اپل سیستم‌عامل macOS Golden Gate را معرفی کرد

اپل سیستم‌عامل macOS Golden Gate را معرفی کرد

19 خرداد 1405

داغ‌ترین‌های روز

نخستین جنگنده دوکابینه Gripen F جهان رونمایی شد

نخستین جنگنده دوکابینه Gripen F جهان رونمایی شد

19 خرداد 1405 - به‌روزشده در 20 خرداد 1405
نصب موتور Pratt & Whitney F135 روی نخستین جنگنده رادارگریز F-35A آلمان در خط مونتاژ نهایی شرکت Lockheed Martin

نخستین جنگنده F-35A آلمان وارد مرحله نهایی تولید شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
تارا بهتر است یا دنا پلاس؟ مقایسه کامل مشخصات، مزایا، معایب و ارزش خرید

تارا بهتر است یا دنا پلاس؟ + مزایا، معایب و ارزش خرید

14 خرداد 1405 - به‌روزشده در 17 خرداد 1405
آیفون 17 پرو مکس سفارشی کاویار با طراحی الهام‌گرفته از ساعت‌های نجومی لوکس در جعبه اختصاصی آبی‌رنگ.

آیفون 17 پرومکس کاویار با محفظه اختصاصی ساعت سوئیسی رونمایی شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
حقوق پخش جام جهانی ۲۰۲۶ به چه رسانه‌هایی رسید؟؛ فهرست کامل رسانه‌های رسمی جام جهان FIFA

رسانه‌های رسمی جام جهانی ۲۰۲۶ مشخص شدند

18 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

یک تصویر گرافیکی مدرن و انتزاعی از لوگوی یوتیوب. کلمه YouTube با فونت سفید روی یک کادر قرمز بزرگ و منحنی قرار گرفته است. در پس‌زمینه، اشکال هندسی نامنظم به رنگ‌های قرمز، سیاه و سفید دیده می‌شوند که حسی از پویایی و رسانه‌های دیجیتال را منتقل می‌کنند

یوتیوب پیام‌رسانی خصوصی را دوباره فعال کرد

21 خرداد 1405
افزایش قیمت کامپیوترهای لنوو به‌دلیل حافظه

لنوو به‌دلیل گرانی رم قیمت رایانه های شخصی را افزایش می دهد

21 خرداد 1405
نمای نزدیک از یک استابلایزر و گیمبال گوشی هوشمند مشکی رنگ که روی یک سنگ در دشت گل‌های زرد قرار دارد. در پس‌زمینه، کوه‌های پوشیده از برف زیر آسمان آبی دیده می‌شوند. صفحه نمایش کوچک روی دسته‌ی گیمبال، تصویر منظره را نشان می‌دهد

دوربین گیمبال Luna Ultra اینستا با سنسور 8K وارد بازار شد

21 خرداد 1405
مینی‌ون پرچمدار Maextro V800 در نمای سه‌رخ با طراحی لوکس، بدنه دو رنگ و فناوری‌های هوشمند Huawei

مینی‌ون فوق‌لوکس Maextro V800 رونمایی شد

21 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir