دیپ مایند با توسعه مدل هوش مصنوعی RoboCat، ادعا می کند که این اولین مدل است که توانایی حل و تطبیق با چندین وظیفه را با استفاده از رباتهای واقعی دارد.
به گزارش تکناک، الکس لی، دانشمند تحقیقاتی در دیپ مایند و یکی از همکاران تیم پشتیبان RoboCat، به TechCrunch گفت: ما نشان میدهیم که یک مدل بزرگ میتواند مجموعه متنوعی از وظایف را در چندین تجسم رباتیک واقعی حل کند و میتواند به سرعت با وظایف و تجسمهای جدید سازگار شود.
RoboCat از Gato که یک مدل هوش مصنوعی DeepMind است و می تواند متن، تصاویر و رویدادها را تجزیه و تحلیل کند، الهام گرفته شده است. RoboCat بر روی تصاویر و داده های عملی جمع آوری شده از روباتیک چه در شبیه سازی و چه در زندگی واقعی آموزش دیده است. لی میگوید این دادهها از ترکیب مدلهای دیگر کنترلکننده ربات در محیطهای مجازی، رباتهای کنترل شونده توسط انسان و تکرارهای قبلی خود RoboCat به دست آمده است.
محققان DeepMind برای آموزش روبوکت، ابتدا بین 100 تا 1000 نمایش از یک وظیفه رباتی را با استفاده از یک بازوی رباتیک که توسط یک انسان کنترل می شود جمع آوری کردند. تصور کنید یک بازوی روباتیک چرخ دنده ها را جمع کند یا بلوک ها را روی هم قرار دهد. سپس، روبوکت را بر روی این کار تنظیم کردند و یک مدل تخصصی اسپین آف ایجاد کردند که به طور متوسط 10هزار بار روی این کار تمرین کرد.
محققان با استفاده از داده های تولید شده توسط مدل های اسپین آف و داده های نمایشی، به طور مداوم مجموعه داده های آموزشی روبو کت را افزایش دادند و نسخه های جدید بعدی روبو کت را آموزش دادند.
نسخه نهایی مدل روبوکت در مجموع برای 253 وظیفه آموزش داده شد و بر روی مجموعه ای از 141 تنوع از این وظایف، هم در شبیه سازی و هم در دنیای واقعی محک زده شد.DeepMind ادعا می کند که پس از روبوکت 1000 نمایش کنترل شده توسط انسان که طی چند ساعت جمع آوری شده بودند، RoboCat یاد گرفت که با بازوهای رباتیک مختلف کار کند.
این مدل در حالی که RoboCat بر روی چهار نوع ربات با بازوهای دو شاخه آموزش دیده بود، توانست خود را با بازوی پیچیده تر با گیره سه انگشتی و دو برابر ورودی های قابل کنترل سازگار کند.
عملکرد RoboCat، یکی از جدیدترین مدلهای هوش مصنوعی که برای کنترل رباتها ساخته شده، در وظایف آزمایشگاهی DeepMind بسیار متغیر بوده است. بازده این مدل در محدوده وسیعی از 13 درصد در سطح ساده تا 99 درصد در سطح پیشرفته قرار دارد. این نتایج با استفاده از 1000 مورد از دادههای آموزشی به دست آمده است. میتوان انتظار داشت که اگر تعداد موارد استفاده شده برای آموزش کاهش یابد، درصد موفقیت هم کاهش پیدا کند.
با این حال، در برخی از سناریوها، DeepMind ادعا میکند که RoboCat قادر به یادگیری وظایف جدید با حداقل 100 نمایش بوده است. لی با نگاهی بیشتر عنوان می کند که RoboCat می تواند از کاهش موانع برای حل وظایف جدید در رباتیک خبر دهد.
او افزود: با ارائه تعداد محدودی نمایش برای یک کار جدید، RoboCat می تواند به خوبی با وظایف جدید تنظیم شود و به نوبه خود داده های بیشتری را برای بهبود بیشتر تولید کند.
در ادامه، تیم تحقیقاتی قصد دارد تعداد نمایشهای مورد نیاز برای آموزش RoboCat برای تکمیل یک کار جدید را به کمتر از 10 کاهش دهد.