متا رقیبی جدید برای هوش مصنوعی ChatGPT معرفی کرد

محققان متا یک مدل زبان هوش مصنوعی به نام Toolformer را معرفی کرده اند که می‌تواند به صورت خودآموز از ابزارهای خارجی مانند موتورهای جستجو، ماشین‌حساب و تقویم‌ها استفاده کند.

به گزارش تکناک، مدل‌های زبانی مانند ChatGPT انقلابی در زمینه پردازش زبان طبیعی ایجاد کرده‌اند، اما هنوز با انجام برخی از کارها مانند انجام محاسبات ریاضی و صحت سنجی دچار مشکل هستند.

نکته کلیدی مدل زبان هوش مصنوعی Toolformer متا این است که می تواند از API ها (اپلیکیشن واسط های برنامه نویسی ) استفاده کند، که مجموعه ای از پروتکل ها هستند که به برنامه های مختلف اجازه می دهد اغلب به صورت یکپارچه و خودکار، با یکدیگر ارتباط برقرار کنند.

در طول آموزش، محققان مجموعه کوچکی از نمونه‌های نوشته شده توسط انسان را به Toolformer ارائه کردند که نشان می‌داد چگونه از هر API استفاده می‌شود و سپس به آن اجازه دادند تا مجموعه داده مدل‌سازی زبان بزرگی را با فراخوان‌های بالقوه API تفسیر کند. آنها این کار را به روش “خود نظارتی” انجام داد، به این معنی که Toolformer می توانست بدون نیاز به راهنمایی صریح انسانی آموزش ببیند.

مدل Toolformer یاد گرفت که هر فراخوانی بر پایه متن API را به گونه‌ای پیش‌بینی کند که گویی شکل دیگری از متن است. هنگامی که در حال کار است تولید متن به عنوان نتیجه یک ورودی انسانی می تواند در صورت نیاز تماس ها را وارد کند. علاوه بر این، Toolformer می‌تواند خودش «تصمیم بگیرد» از کدام ابزار برای زمینه مناسب و نحوه استفاده از آن استفاده کند.

مدل Toolformer در حین انجام وظایف محول شده به او می تواند در صورت نیازAPI های مورد نیاز را فراخوانی کند. علاوه بر این، Toolformer می‌تواند خودش «تصمیم بگیرد» ابزار و نحوه استفاده آن را انتخاب کند.

تصاویری که توسط محقق متا، تیمو شیک ارائه شده است، نمونه‌ای از فراخوانی API توسط Toolformer را نشان می‌دهد که در حال برقراری تماس API با برنامه تقویم است.

این قابلیت فراخوانی API، Toolformer را قادر می سازد از ابزارهای نرم افزاری خارجی مانند موتورهای جستجو، ماشین حساب، مترجم زبان و مراجع واقعی استفاده کند. به عنوان مثال، مدل‌های زبان بزرگ (LLM) به دلیل نداشتن مهارت خاصی در انجام محاسبات ریاضی معروف هستند. Toolformer می تواند با استفاده از یک برنامه ماشین حساب این محدودیت را برطرف کند. یا اگر کسی بخواهد با یک دستیار مبتنی بر LLM یک تاریخ را به تقویم خود اضافه کند، Toolformer می‌تواند این کار را با استفاده از لینک API به یک برنامه تقویم انجام دهد.

مدل زبان هوش مصنوعی Toolformer متابر اساس یک مدل GPT-J از پیش آموزش دیده با 6.7 میلیارد پارامتر است. به نظر می رسد آزمایش های انجام شده توسط محققان بر روی وظایف مختلف که به استفاده از ابزار های خارجی دارند ،نشان می دهد که Toolformer نسبت به مدل بسیار بزرگتر GPT-3 که شامل 175 میلیارد پارامتر است، عملکرد بسیار قوی تری دارد.

این اولین باری نیست که محققان تلاش می‌کنند محدودیت‌های موجود در مدل‌های زبان هوش مصنوعی را جبران کنند. در واقع، مدل اخیر Bing Chat که هفته پیش رونمایی شد می‌تواند در صورت نیاز به تنهایی جستجوهای وب را انجام دهد و سایر مدل ها سعی کرده‌اند با مرورگرها، ماشین‌حساب‌ها و موتورهای جستجو ادغام شوند.

به گفته محققان متا، بیشتر رویکردهای موجود برای ادغام ابزارها در مدل‌های زبانی بر مقادیر زیادی از تفسیر های انسانی تکیه کرده‌اند یا به تنظیمات خاص کار محدود شده‌اند. در مقابل، Toolformer می تواند یاد بگیرد که از طیف وسیعی از ابزارها به صورت کلی استفاده کند که نیازی به آموزش تخصصی برای کارهای خاص ندارد.

اما توانایی انجام فراخوانی API همچنین ممکن است توانایی LLM برای آسیب رساندن به داده‌های کاربر (در برنامه‌ها) یا ایجاد مشکل در دنیای خارج (از طریق مرورگر وب یا ابزارهای ارتباطی) را افزایش دهد.