OpenAI از ChatGPT Agent پرده‌برداری کرد

ChatGPT Agent می‌تواند وظایف پیچیده و چندمرحله‌ای را به‌طور خودکار انجام دهد و حتی ازطریق کامپیوتر مجازی‌اش امور مختلف شما را کنترل کند.

به گزارش تک‌ناک، OpenAI رسماً از ابزار جدیدی به نام ChatGPT Agent پرده‌برداری کرده است که می‌تواند به‌صورت مستقل کنترل کامل کامپیوتر را در دست بگیرد و مجموعه‌ای از وظایف پیچیده و چندمرحله‌ای را برای کاربر انجام دهد. این ابزار گامی فراتر از چت‌بات‌های معمولی برمی‌دارد و در مسیر توسعه عامل‌های هوش مصنوعی هوشمندتر حرکت می‌کند.

OpenAI در معرفی این محصول اعلام کرد که ChatGPT Agent ازطریق «کامپیوتر مجازی» فعالیت می‌کند و وظایفی مانند بررسی تقویم کاربر، برنامه‌ریزی جلسه‌های کاری، خرید اقلام موردنیاز برای وعده‌های غذایی خانوادگی و حتی تهیه اسلایدهای ارائه بر‌اساس تحلیل رقبا را می‌تواند انجام دهد.

ورج می‌نویسد که برای توسعه این ابزار، OpenAI از مدلی جدید و بدون نام بهره گرفته که به‌صورت ویژه برای انجام وظایف پیچیده طراحی شده است. این مدل با استفاده از یادگیری تقویتی و با به‌کارگیری ابزارهایی مانند مرورگر متنی و مرورگر تصویری و ترمینال، آموزش دیده است. کاربران می‌توانند داده‌های شخصی خود را برای تحلیل به ابزار وارد کنند.

عامل ChatGPT ترکیبی از دو ابزار پیشین OpenAI به نام‌های Operator و Deep Research است. تیم‌های سازنده این دو ابزار برای توسعه عامل جدید ادغام شده‌اند و اکنون تیمی متشکل از ۲۰ تا ۳۵ نفر در بخش‌های تحقیق و محصول بر توسعه آن نظارت می‌کنند.

در نمایش زنده برای رسانه ورج، مدیر محصول و مدیر تحقیقات این پروژه، یاش کومار و ایسا فالفورد، قابلیت‌های ChatGPT Agent را به نمایش گذاشتند. ازجمله این کاربردها می‌توان به برنامه‌ریزی قرار شام با استفاده از تقویم گوگل و رزرو رستوران ازطریق OpenTable اشاره کرد. همچنین، کاربران می‌توانند در میانه اجرا، درخواست‌های جدیدی به فرایند اضافه کنند.

اگرچه ChatGPT Agent ابزار قدرتمندی است، طبق گزارش‌ها ممکن است اجرای آن کمی زمان‌بر باشد. کومار در‌این‌باره گفت که تمرکز تیم روی بهینه‌سازی برای وظایف دشوار است، نه کاهش تأخیر. فالفورد نیز افزود:

حتی اگر انجام یک کار ۱۵ یا ۳۰ دقیقه طول بکشد، بازهم بسیار سریع‌تر از حالت دستی است.

این ابزار پیش‌از انجام اقدامات بازگشت‌ناپذیر مانند ارسال ایمیل یا رزرو، از کاربر اجازه می‌گیرد. همچنین، محافظت‌هایی که برای جلوگیری از سوءاستفاده‌های زیستی و شیمیایی طراحی شده‌اند، فعال شده‌اند؛ اگرچه OpenAI تأکید می‌کند که مدرک مستقیمی مبنی‌بر توانایی مدل در ایجاد چنین خطرهایی وجود ندارد.

درحال‌حاضر، ChatGPT Agent اجازه انجام تراکنش‌های مالی را ندارد. قابلیتی به نام Watch Mode نیز اضافه شده است که درصورت ورود کاربر به وبسایت‌های مالی، از تغییر تب جلوگیری می‌کند تا فعالیت ابزار متوقف نشود.

انتشار عمومی این ابزار OpenAI از امروز آغاز شده و در دسترس کاربران Pro و Plus و Team قرار گرفته است. کاربران می‌توانند با انتخاب گزینه «Agent Mode» از منو ابزارها یا تایپ دستور «/agent» از آن استفاده کنند. قرار است نسخه‌های مخصوص سازمان‌ها و آموزش نیز در تابستان آینده منتشر شوند. با‌این‌حال، هنوز زمان دقیقی برای انتشار در منطقه اقتصادی اروپا و سوئیس اعلام نشده است.

معرفی ChatGPT Agent ادامه‌ای بر مسیر OpenAI در ساخت عامل‌های هوشمند است؛ مسیری که با انتشار ابزار Operator در ژانویه آغاز شد. شرکت‌هایی مانند آنتروپیک ابزارهایی مشابه با نام «Computer Use» منتشر کرده‌اند. این ابزارها وعده می‌دهند که مانند انسان بتوانند از کامپیوتر استفاده کنند و وظایف کاربر را انجام دهند.

در مقابل، ابزار Deep Research که به‌صورت مشترک OpenAI و گوگل و پرپلکسیتی منتشر کرده‌اند، توانایی نگارش گزارش‌ها و تحلیل‌های عمیق در موضوعات مختلف را به کاربران می‌دهد. با انتشار ChatGPT Agent، رقابت در بازار عامل‌های هوش مصنوعی وارد مرحله‌ای تازه شده است و به نظر می‌رسد آینده تعامل با کامپیوترها دیگر به تایپ دستورها محدود نخواهد بود.