محققان متا یک مدل زبان هوش مصنوعی به نام Toolformer را معرفی کرده اند که میتواند به صورت خودآموز از ابزارهای خارجی مانند موتورهای جستجو، ماشینحساب و تقویمها استفاده کند.
به گزارش تکناک، مدلهای زبانی مانند ChatGPT انقلابی در زمینه پردازش زبان طبیعی ایجاد کردهاند، اما هنوز با انجام برخی از کارها مانند انجام محاسبات ریاضی و صحت سنجی دچار مشکل هستند.
نکته کلیدی مدل زبان هوش مصنوعی Toolformer متا این است که می تواند از API ها (اپلیکیشن واسط های برنامه نویسی ) استفاده کند، که مجموعه ای از پروتکل ها هستند که به برنامه های مختلف اجازه می دهد اغلب به صورت یکپارچه و خودکار، با یکدیگر ارتباط برقرار کنند.
در طول آموزش، محققان مجموعه کوچکی از نمونههای نوشته شده توسط انسان را به Toolformer ارائه کردند که نشان میداد چگونه از هر API استفاده میشود و سپس به آن اجازه دادند تا مجموعه داده مدلسازی زبان بزرگی را با فراخوانهای بالقوه API تفسیر کند. آنها این کار را به روش “خود نظارتی” انجام داد، به این معنی که Toolformer می توانست بدون نیاز به راهنمایی صریح انسانی آموزش ببیند.
مدل Toolformer یاد گرفت که هر فراخوانی بر پایه متن API را به گونهای پیشبینی کند که گویی شکل دیگری از متن است. هنگامی که در حال کار است تولید متن به عنوان نتیجه یک ورودی انسانی می تواند در صورت نیاز تماس ها را وارد کند. علاوه بر این، Toolformer میتواند خودش «تصمیم بگیرد» از کدام ابزار برای زمینه مناسب و نحوه استفاده از آن استفاده کند.
مدل Toolformer در حین انجام وظایف محول شده به او می تواند در صورت نیازAPI های مورد نیاز را فراخوانی کند. علاوه بر این، Toolformer میتواند خودش «تصمیم بگیرد» ابزار و نحوه استفاده آن را انتخاب کند.
این قابلیت فراخوانی API، Toolformer را قادر می سازد از ابزارهای نرم افزاری خارجی مانند موتورهای جستجو، ماشین حساب، مترجم زبان و مراجع واقعی استفاده کند. به عنوان مثال، مدلهای زبان بزرگ (LLM) به دلیل نداشتن مهارت خاصی در انجام محاسبات ریاضی معروف هستند. Toolformer می تواند با استفاده از یک برنامه ماشین حساب این محدودیت را برطرف کند. یا اگر کسی بخواهد با یک دستیار مبتنی بر LLM یک تاریخ را به تقویم خود اضافه کند، Toolformer میتواند این کار را با استفاده از لینک API به یک برنامه تقویم انجام دهد.
مدل زبان هوش مصنوعی Toolformer متابر اساس یک مدل GPT-J از پیش آموزش دیده با 6.7 میلیارد پارامتر است. به نظر می رسد آزمایش های انجام شده توسط محققان بر روی وظایف مختلف که به استفاده از ابزار های خارجی دارند ،نشان می دهد که Toolformer نسبت به مدل بسیار بزرگتر GPT-3 که شامل 175 میلیارد پارامتر است، عملکرد بسیار قوی تری دارد.
این اولین باری نیست که محققان تلاش میکنند محدودیتهای موجود در مدلهای زبان هوش مصنوعی را جبران کنند. در واقع، مدل اخیر Bing Chat که هفته پیش رونمایی شد میتواند در صورت نیاز به تنهایی جستجوهای وب را انجام دهد و سایر مدل ها سعی کردهاند با مرورگرها، ماشینحسابها و موتورهای جستجو ادغام شوند.
به گفته محققان متا، بیشتر رویکردهای موجود برای ادغام ابزارها در مدلهای زبانی بر مقادیر زیادی از تفسیر های انسانی تکیه کردهاند یا به تنظیمات خاص کار محدود شدهاند. در مقابل، Toolformer می تواند یاد بگیرد که از طیف وسیعی از ابزارها به صورت کلی استفاده کند که نیازی به آموزش تخصصی برای کارهای خاص ندارد.
اما توانایی انجام فراخوانی API همچنین ممکن است توانایی LLM برای آسیب رساندن به دادههای کاربر (در برنامهها) یا ایجاد مشکل در دنیای خارج (از طریق مرورگر وب یا ابزارهای ارتباطی) را افزایش دهد.