ChatGPT Agent میتواند وظایف پیچیده و چندمرحلهای را بهطور خودکار انجام دهد و حتی ازطریق کامپیوتر مجازیاش امور مختلف شما را کنترل کند.
به گزارش تکناک، OpenAI رسماً از ابزار جدیدی به نام ChatGPT Agent پردهبرداری کرده است که میتواند بهصورت مستقل کنترل کامل کامپیوتر را در دست بگیرد و مجموعهای از وظایف پیچیده و چندمرحلهای را برای کاربر انجام دهد. این ابزار گامی فراتر از چتباتهای معمولی برمیدارد و در مسیر توسعه عاملهای هوش مصنوعی هوشمندتر حرکت میکند.
OpenAI در معرفی این محصول اعلام کرد که ChatGPT Agent ازطریق «کامپیوتر مجازی» فعالیت میکند و وظایفی مانند بررسی تقویم کاربر، برنامهریزی جلسههای کاری، خرید اقلام موردنیاز برای وعدههای غذایی خانوادگی و حتی تهیه اسلایدهای ارائه براساس تحلیل رقبا را میتواند انجام دهد.
ورج مینویسد که برای توسعه این ابزار، OpenAI از مدلی جدید و بدون نام بهره گرفته که بهصورت ویژه برای انجام وظایف پیچیده طراحی شده است. این مدل با استفاده از یادگیری تقویتی و با بهکارگیری ابزارهایی مانند مرورگر متنی و مرورگر تصویری و ترمینال، آموزش دیده است. کاربران میتوانند دادههای شخصی خود را برای تحلیل به ابزار وارد کنند.
عامل ChatGPT ترکیبی از دو ابزار پیشین OpenAI به نامهای Operator و Deep Research است. تیمهای سازنده این دو ابزار برای توسعه عامل جدید ادغام شدهاند و اکنون تیمی متشکل از ۲۰ تا ۳۵ نفر در بخشهای تحقیق و محصول بر توسعه آن نظارت میکنند.
در نمایش زنده برای رسانه ورج، مدیر محصول و مدیر تحقیقات این پروژه، یاش کومار و ایسا فالفورد، قابلیتهای ChatGPT Agent را به نمایش گذاشتند. ازجمله این کاربردها میتوان به برنامهریزی قرار شام با استفاده از تقویم گوگل و رزرو رستوران ازطریق OpenTable اشاره کرد. همچنین، کاربران میتوانند در میانه اجرا، درخواستهای جدیدی به فرایند اضافه کنند.
اگرچه ChatGPT Agent ابزار قدرتمندی است، طبق گزارشها ممکن است اجرای آن کمی زمانبر باشد. کومار دراینباره گفت که تمرکز تیم روی بهینهسازی برای وظایف دشوار است، نه کاهش تأخیر. فالفورد نیز افزود:
حتی اگر انجام یک کار ۱۵ یا ۳۰ دقیقه طول بکشد، بازهم بسیار سریعتر از حالت دستی است.
این ابزار پیشاز انجام اقدامات بازگشتناپذیر مانند ارسال ایمیل یا رزرو، از کاربر اجازه میگیرد. همچنین، محافظتهایی که برای جلوگیری از سوءاستفادههای زیستی و شیمیایی طراحی شدهاند، فعال شدهاند؛ اگرچه OpenAI تأکید میکند که مدرک مستقیمی مبنیبر توانایی مدل در ایجاد چنین خطرهایی وجود ندارد.
درحالحاضر، ChatGPT Agent اجازه انجام تراکنشهای مالی را ندارد. قابلیتی به نام Watch Mode نیز اضافه شده است که درصورت ورود کاربر به وبسایتهای مالی، از تغییر تب جلوگیری میکند تا فعالیت ابزار متوقف نشود.

انتشار عمومی این ابزار OpenAI از امروز آغاز شده و در دسترس کاربران Pro و Plus و Team قرار گرفته است. کاربران میتوانند با انتخاب گزینه «Agent Mode» از منو ابزارها یا تایپ دستور «/agent» از آن استفاده کنند. قرار است نسخههای مخصوص سازمانها و آموزش نیز در تابستان آینده منتشر شوند. بااینحال، هنوز زمان دقیقی برای انتشار در منطقه اقتصادی اروپا و سوئیس اعلام نشده است.
معرفی ChatGPT Agent ادامهای بر مسیر OpenAI در ساخت عاملهای هوشمند است؛ مسیری که با انتشار ابزار Operator در ژانویه آغاز شد. شرکتهایی مانند آنتروپیک ابزارهایی مشابه با نام «Computer Use» منتشر کردهاند. این ابزارها وعده میدهند که مانند انسان بتوانند از کامپیوتر استفاده کنند و وظایف کاربر را انجام دهند.
در مقابل، ابزار Deep Research که بهصورت مشترک OpenAI و گوگل و پرپلکسیتی منتشر کردهاند، توانایی نگارش گزارشها و تحلیلهای عمیق در موضوعات مختلف را به کاربران میدهد. با انتشار ChatGPT Agent، رقابت در بازار عاملهای هوش مصنوعی وارد مرحلهای تازه شده است و به نظر میرسد آینده تعامل با کامپیوترها دیگر به تایپ دستورها محدود نخواهد بود.