شرکت انویدیا قصد دارد با هوش مصنوعی Eureka مهارتهای پیچیدهی انسانی مانند مانند بازکردن کابینتها و دراورها و پرتاب و گرفتن توپ و استفاده از قیچی را به رباتها بیاموزد.
بهگزارش تکناک، هوش مصنوعیای به نام Eureka که تیم پژوهشی شرکت NVIDIA (American multinational technology company) آن را توسعه داده است، میتواند به رباتها مهارتهای پیچیدهای همچون چرخش سریع قلم مانند عملکرد انسان را آموزش دهد. این فقط یکی از ۳۰وظیفهای است که با استفاده از هوش مصنوعی به رباتها آموزش داده شده است.
انویدیا (شرکت سازنده سخت افزار کامپیوتر و کارت های توسعه مانند کارت گرافیک در کالیفرنیا) که بهدلیل GPUهای خود که امکان آموزش ChatGPT را فراهم کرد، شناخته شده است، همچنین، در حال کار روی پلتفرم توسعهی خود، یعنی Omniverse، برای ساخت ابزارها و برنامههای سهبعدی است. در اوایل سال جاری، این شرکت هوش مصنوعی Voyager خود را معرفی کرد که در بازی Minecraft میتوانست ابزارها را با 15 برابر سرعت بیشتر از سایر هوشهای مصنوعی بسازد.
هوش مصنوعی Voyager با استفاده از مدل زبان بزرگ (LLM) GPT-4 ساخته شده است و تیم NVIDIA اکنون از همین مدل برای ایجاد عاملی جدید استفاده کرده است که میتواند مهارتهای پیچیده را در حد انسانها فرابگیرد.
فهرست مطالب
Eureka چگونه کار میکند؟
یادگیری تقویتی (RL) چند سالی است که بهطور گسترده در هوش مصنوعی استفاده میشود. آنیما آراندکومار (Anima Anandkumar)، مدیر ارشد تحقیقات هوش مصنوعی در NVIDIA، در بیانیهای مطبوعاتی گفت:
یادگیری تقویتی در دههی گذشته موفقیتهای چشمگیری بههمراه داشته است؛ اما هنوز مشکلات بسیاری وجود دارد. یکی از این مشکلات طراحی پاداش است که هنوز در مرحلهی آزمون و خطاست.
Eureka یک قدم جلوتر میرود و با استفاده از هوش مصنوعی مولد، کد نرمافزاری را تولید میکند که ازطریق یادگیری تقویتی به رباتها پاداش میدهد. این کار با استفاده از GPT-4 LLM انجام میشود و به درخواست با وظیفهی مشخص یا الگوی ازپیشتعیینشده نیازی ندارد. علاوهبراین، هوش مصنوعی میتواند بازخورد انسانی را دربر گیرد تا پاداشها را تغییر و نتایج را بهبود دهد.
کتابخانهی الگوریتمهای Eureka میتواند در Isaac Gym استفاده شود. Isaac Gym برنامهی مرجع شبیهسازی فیزیکی NVIDIA است که روی Omniverse ساخته شده و برای تحقیق در حوزهی یادگیری تقویتی استفاده میشود. با استفاده از GPUهای انویدیا، Isaac Gym میتواند حتی دستههای بزرگی از نامزدهای پاداش را بهسرعت ارزیابی کند و کارایی آموزش را بهبود بخشد.
سپس، هوش مصنوعی خلاصهای آماده میکند که به LLM داده میشود تا با استفاده از آمارهای مهم از نتایج آموزش، توابع پاداش را بهبود بخشد. این رویکرد برای انواع گستردهای از رباتها استفاده شده است؛ مانند رباتهای چهارپا و دوپا و چهارپره با دستان ماهر.
نتایج حاصل از محیطهای Isaac Gym میتوانند در Omniverse انویدیا بهصورت تصویری نمایش داده شوند که در زیر نمونهای از آن نمایش داده شده است.
هوش مصنوعی NVIDIA چقدر خوب کار میکند؟
بهجز چرخش سریع قلم، محققان NVIDIA با موفقیت رباتها را در انجام وظایف پیچیده دیگر نیز آموزش دادند؛ مانند بازکردن کابینتها و دراورها و پرتاب و گرفتن توپ و استفاده از قیچی.
براساس مقالهای که تیم NVIDIA منتشر کرده است، پاداشهای تولیدشده با Eureka در بیش از 80درصد از وظایف انجامشده بهتر از پاداشهای نوشتهشده بهدست انسان عمل کردند. این پاداشها بیش از 50درصد به بهبود عملکرد در رباتها منجر شد.
همچنین، مقالهی یادشده بهبودهای عملکرد را در ارزیابیهای عمیق 20 وظیفه که رباتها با استفاده از Eureka آموزش دیده بودند و مهارتهای پیچیدهی مربوط به مهارتهای دستکاری را دربر میگیرد، فهرست کرده است.
NVIDIA با اطمینان میگوید که پیشرفتهای اخیرش توسعهدهندگان را تشویق خواهد کرد تا به پروژههای بلندپروازانه و چالشبرانگیزی بپردازند. جیم فن، دانشمند ارشد تحقیقاتی در NVIDIA، اضافه کرد:
معتقدیم که Eureka میتواند امکان کنترل رباتهای ماهر را فراهم کند و راهی جدید برای تولید انیمیشنهای واقعگرایانهی فیزیکی برای هنرمندان فراهم کند.