No Result

مشاهده تمامی نتایج

No Result

مشاهده تمامی نتایج

تک ناک » فناوری » مدل Gemini 2.5 Computer Use گوگل با توانایی تعامل با وب معرفی شد + ویدیو

مدل Gemini 2.5 Computer Use گوگل با توانایی تعامل با وب معرفی شد + ویدیو

نوشته شده توسط سید محمد برازنده

چهارشنبه 16 مهر 1404 - 09:25

در اخبار هوش مصنوعی, فناوری

مدل Gemini 2.5 Computer Use گوگل با توانایی تعامل با وب معرفی شد

شرکت گوگل با رونمایی از مدل جدید Gemini 2.5 Computer Use که توانایی تعامل با وب را دارد، گام تازه‌ای در تعامل انسان و ماشین برداشته است.

Affilio.widget({autosize: true,
container_id:’affilio_5371750396315023759′,
widget_type:’ProductWidget’,
widget_id: ‘4718712520364520888’,
redirect_type: ‘ProductPage’,
url: ”,
is_smart: false,
})

به گزارش تک‌ناک، این نسخه تازه از خانواده‌ مدل‌های Gemini با هدف درک و تعامل با رابط‌های کاربری انسانی طراحی شده است و می‌تواند درون صفحات وب، فرم‌ها و محیط‌های گرافیکی فعالیت کند، بدون آنکه به API یا ابزارهای خودکارسازی سنتی نیاز داشته باشد و کارهایی را انجام دهد که پیش‌تر تنها از انسان برمی‌آمد.

Affilio.widget({autosize: true,
container_id:’affilio_5655254640508779920′,
widget_type:’ProductWidget’,
widget_id: ‘4914785146198394184’,
redirect_type: ‘ProductPage’,
url: ”,
is_smart: false,
})

به گفته‌ گوگل، مدل Gemini 2.5 Computer Use از توانایی‌های پیشرفته‌ای در زمینه‌ «درک بصری و استدلال منطقی» برخوردار است. این مدل می‌تواند درخواست‌های کاربر را تحلیل کند و به‌ صورت خودکار اقداماتی مانند: پر کردن فرم‌ها، کلیک روی گزینه‌ها، یا ارسال داده‌ها را انجام دهد. چنین قابلیتی می‌تواند تحول بزرگی در حوزه‌ آزمایش رابط کاربری (UI Testing) و تعامل خودکار با وب‌سایت‌هایی ایجاد کند که برای استفاده‌ ماشینی طراحی نشده‌اند.

شرکت گوگل پیش‌تر نمونه‌های اولیه‌ای از این فناوری را در پروژه‌هایی مانند AI Mode و Project Mariner آزمایش کرده بود. در این پروژه‌ها، عامل‌های هوش مصنوعی قادر بودند در مرورگر، وظایف پیچیده‌ای را به‌ صورت خودکار انجام دهند؛ به عنوان مثال، افزودن اقلام به سبد خرید بر اساس فهرست مواد اولیه یا مرور صفحات برای انجام وظایف خاص را انجام می‌دادند.

رونمایی از Gemini 2.5 تنها یک روز پس از برگزاری رویداد سالانه‌ Dev Day شرکت OpenAI انجام شد؛ رویدادی که در آن اپلیکیشن‌های جدید ChatGPT و قابلیت تازه‌ ChatGPT Agent معرفی شدند. هم‌زمان با این رقابت فشرده در حوزه‌ هوش مصنوعی عامل‌محور (Agentic AI)، شرکت Anthropic نیز پیش‌تر نسخه‌ای از مدل Claude را با قابلیت «استفاده از رایانه» عرضه کرده بود.

با وجود این، گوگل تأکید کرده است که مدل جدید آنها در مقایسه با رقبای موجود، عملکرد بهتری در چندین معیار ارزیابی وب و موبایل داشته است. البته برخلاف ابزارهای مشابه از OpenAI و Anthropic، مدل Gemini 2.5 تنها به مرورگر وب دسترسی دارد و هنوز برای کنترل کامل محیط سیستم‌عامل دسکتاپ بهینه‌سازی نشده است.

این مدل در حال حاضر از ۱۳ نوع عملکرد پشتیبانی می‌کند، که از جمله آنها می‌توان به باز کردن مرورگر، تایپ متن، کلیک، قابلیت کشیدن و رها کردن عناصر در صفحه اشاره کرد. همچنین گوگل ویدیوهایی از عملکرد این ابزار منتشر کرده است که سه برابر سریع‌تر از حالت واقعی پخش می‌شوند تا فرایند اجرای وظایف به شکل روان‌تری به نمایش درآید.

مدل Gemini 2.5 Computer Use گوگل هم‌اکنون از طریق Google AI Studio و پلتفرم Vertex AI در اختیار توسعه‌دهندگان قرار گرفته است. علاوه بر این، نسخه‌ نمایشی آن در وب‌سایت Browserbase نیز در دسترس عموم قرار دارد، جایی که کاربران می‌توانند عملکرد این مدل را در اجرای وظایفی مانند «بازی 2048» یا «مرور مباحث داغ Hacker News» مشاهده کنند.

این اقدام تازه، نشان می‌دهد که گوگل در مسیر رقابت با سایر غول‌های هوش مصنوعی، تمرکز خود را بر توسعه‌ مدل‌هایی گذاشته است که می‌توانند در محیط‌های واقعی انسانی فعالیت کنند؛ گامی مهم به سوی آینده‌ای که در آن عامل‌های هوشمند نه در پس‌زمینه، بلکه درون همان ابزارهایی کار خواهند کرد که انسان‌ها استفاده می‌کنند.

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

تصاویر زنده Nothing Phone (4b) در سه رنگ پیش از رونمایی رسمی

تصاویر زنده (4b) Nothing Phone منتشر شد

نوشته شده توسط ساینا چمنی

ربات‌های انسان‌نمای AGIBOT رکورد جدیدی در عملکرد پایدار ثبت کردند

ربات‌های انسان‌نمای AGIBOT رکورد جدیدی در عملکرد پایدار ثبت کردند + ویدیو

نوشته شده توسط نرگس چالوک

سامسونگ از Galaxy Ring 2 با احتمال پشتیبانی از آیفون رونمایی می‌کند

نوشته شده توسط ساینا چمنی

رادیوی موج‌بلند بی‌بی‌سی

بی‌بی‌سی پخش رادیوی موج‌بلند را خاموش می‌کند

نوشته شده توسط مانی

واتساپ امکان استفاده از نام کاربری بدون شماره تلفن را فراهم کرد

پیشنهاد سردبیر

واتساپ امکان استفاده از نام کاربری بدون شماره تلفن را فراهم کرد

نوشته شده توسط ساینا چمنی

خبر بعدی

اپل به‌روزرسانی جدید Firmware را برای AirPods Pro 3، Pro 2 و AirPods 4 منتشر کرد

اپل به‌روزرسانی جدید Firmware را برای AirPods Pro 3، Pro 2 و AirPods 4 منتشر کرد

دیدگاهتان را بنویسید لغو پاسخ

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

تصاویر زنده Nothing Phone (4b) در سه رنگ پیش از رونمایی رسمی

تصاویر زنده (4b) Nothing Phone منتشر شد

9 تیر 1405

ربات‌های انسان‌نمای AGIBOT رکورد جدیدی در عملکرد پایدار ثبت کردند

ربات‌های انسان‌نمای AGIBOT رکورد جدیدی در عملکرد پایدار ثبت کردند + ویدیو

9 تیر 1405

سامسونگ از Galaxy Ring 2 با احتمال پشتیبانی از آیفون رونمایی می‌کند

9 تیر 1405

کوالکام نسل جدید تراشه‌های پرچم‌دار خود را در شهریور معرفی می‌ کند

کوالکام نسل جدید تراشه‌های پرچم‌دار خود را در شهریور معرفی می‌ کند

9 تیر 1405

دسترسی سریع

© Copyright 2025 Technoc.ir

No Result

مشاهده تمامی نتایج

© Copyright 2025 Technoc.ir