ابداع ربات اسلایمی با قابلیت‌های فراوان

اخیرا دانشمندان یک سری ربات اسلایمی بدون شکل ساخته‌اند که برای انجام کارهای پیچیده تغییر شکل می‌دهند. اما محققان MIT یک تکنیک یادگیری ماشینی را توسعه داده‌اند که این ربات‌های نرم تغییر شکل‌داده را یک قدم به واقعیت نزدیک‌تر می‌کند.

به گزارش تکناک، جهان در سال 1991 با ربات T-1000 که در فیلم ترمیناتور 2 بود، با مفهوم ربات‌های تغییر شکل دهنده آشنا شد. از آن زمان بسیاری از دانشمندان رویای ایجاد رباتی با توانایی تغییر شکل برای انجام وظایف مختلف را در سر می‌پرورانند.

می‌توان گفت اخیرا به ساخت چنین ربات‌هایی نزدیک شده‌ایم، مثلاً تور مغناطیسی از دانشگاه هنگ کنگ، یا مرد لگو فلزی مایع که می‌تواند ذوب شود و دوباره شکل بگیرد. با این حال، هر دوی اینها به کنترل‌های مغناطیسی خارجی نیاز دارند. آنها نمی‌توانند مستقل حرکت کنند.

اما به‌تازگی یک گروه تحقیقاتی در MIT در حال توسعه مواردی هستند که می‌توانند مستقل حرکت کنند. آنها یک تکنیک یادگیری ماشینی را توسعه داده‌اند که یک ربات اسلایمی قابل تنظیم مجدد را آموزش می‌دهد و کنترل می‌کند که می‌چرخد، خم و دراز می‌شود تا با محیط و اشیاء خارجی خود تعامل داشته باشد. نکته جانبی ناامید کننده این است که این ربات از فلز مایع ساخته نشده است.

بویوان چن، از نویسندگان این مطالعه که به تشریح این موضوع می‌پردازد، می‌گوید: وقتی مردم به ربات‌های نرم فکر می‌کنند، بیشتر به ربات‌هایی فکر کنند که انعطاف‌پذیر هستند، اما به شکل اولیه خود باز می‌گردند. این ربات مانند لجن است و در واقع می‌تواند مورفولوژی خود را تغییر دهد.

محققان مجبور شدند راهی برای کنترل یک ربات اسلایمی ابداع کنند که دست، پا یا انگشت ندارد یا در واقع هیچ نوع اسکلتی برای فشار دادن و کشیدن ماهیچه‌هایش ندارد و در واقع می‌توان گفت هیچ مکان مشخصی برای هیچ یک از عضلاتش ندارد. چگونه قرار است حرکات چنین روباتی را برنامه‌ریزی کنیم؟

واضح است که هر نوع طرح کنترل استاندارد در این حالت بی‌فایده خواهد بود، بنابراین محققان به هوش مصنوعی روی آوردند و از توانایی عظیم آن برای مقابله با داده‌های پیچیده استفاده کردند. آنها یک الگوریتم کنترلی توسعه دادند که یاد می‌گیرد چگونه ربات اسلایمی را گاهی اوقات چندین بار برای انجام یک کار خاص حرکت، کشش و شکل دهد.

یادگیری تقویت یک تکنیک یادگیری ماشینی است که نرم افزار را برای تصمیم‌گیری با استفاده از آزمون و خطا آموزش می‌دهد. برای آموزش ربات‌هایی با قطعات متحرک کاملاً مشخص مانند گیره‌ای با انگشتان، می‌تواند برای اقداماتی که آن را به هدف نزدیک‌تر می‌کند، پاداش داده شود مثلاً برداشتن تخم مرغ. اما در مورد یک ربات نرم بدون شکل که توسط میدان‌های مغناطیسی کنترل می‌شود چه می‌توان گفت؟

چن گفت: چنین رباتی می‌تواند هزاران قطعه کوچک عضلانی برای کنترل داشته باشد. بنابراین یادگیری به روش سنتی بسیار سخت است.

یک ربات اسلایمی نیاز به تکه‌های بزرگی از آن دارد که در یک زمان جابجا شوند تا به یک تغییر شکل عملکردی و موثر دست پیدا کنند. دستکاری ذرات منفرد منجر به تغییر اساسی مورد نیاز نخواهد شد. بنابراین،محققان از یادگیری تقویتی به روشی غیر سنتی استفاده کردند.

یک فضای اکشن دوبعدی که در آن نقاط عمل مجاور همبستگی‌های قوی‌تری دارند و تغییر شکل در ربات نرم ایجاد می‌کند

در یادگیری تقویتی، مجموعه‌ای از اقدامات یا انتخاب‌های معتبر در دسترس یک عامل در اثر تعامل با یک محیط، فضای عمل نامیده می‌شود. در اینجا، فضای عمل ربات مانند تصویری متشکل از پیکسل‌ها در نظر گرفته می‌شود. مدل محققان از تصاویر محیط ربات برای ایجاد یک فضای عمل دوبعدی پوشیده شده توسط نقاطی که با یک شبکه پوشانده شده بودند، استفاده کرد.

به همان شکلی که پیکسل‌های نزدیک در یک تصویر به هم مرتبط هستند، الگوریتم محققان متوجه شد که نقاط عمل نزدیک، همبستگی قوی‌تری دارند. بنابراین، نقاط عمل در اطراف بازوی ربات با تغییر شکل با هم حرکت می‌کنند. نقاط عمل روی پا”نیز با هم حرکت می‌کنند، اما متفاوت از حرکت بازو.

همچنین محققان الگوریتمی با یادگیری خط مشی درشت به ریز توسعه دادند. ابتدا، الگوریتم با استفاده از یک خط مشی درشت با وضوح پایین -یعنی حرکت تکه‌های بزرگ برای کشف فضای عمل و شناسایی الگوهای عمل معنی‌دار آموزش داده می‌شود. سپس، یک خط‌مشی با وضوح بالاتر، دقیق و عمیق‌تر برای بهینه‌سازی اقدامات ربات و بهبود توانایی آن برای انجام وظایف پیچیده، کاوش می‌کند.

وینسنت سیتزمن، یکی از نویسندگان مطالعه گفت: خط مشی درشت به ریز به این معنی است که وقتی یک اقدام تصادفی انجام می‌دهید، آن عمل تصادفی احتمالاً تفاوت ایجاد می‌کند. تغییر در نتیجه به احتمال زیاد بسیار قابل توجه است، زیرا شما چندین ماهیچه را به‌طور همزمان کنترل می‌کنید.

قدم بعدی آزمایش رویکرد آنها بود. آنها یک محیط شبیه سازی به نام DittoGym ایجاد کردند که دارای هشت وظیفه است که توانایی یک ربات قابل تنظیم مجدد را برای تغییر شکل ارزیابی می‌کند. به عنوان مثال، تطبیق ربات با یک حرف یا نماد و ایجاد رشد، حفاری، لگد زدن، گرفتن و دویدن.

سانینگ هوانگ، یکی از نویسندگان مطالعه گفت: انتخاب کار ما در DittoGym از اصول طراحی معیار یادگیری تقویتی عمومی و نیازهای خاص ربات‌های قابل تنظیم مجدد پیروی می‌کند.

هوانگ افزود: هر کار به گونه‌ای طراحی شده است که ویژگی‌های خاصی را نشان دهد که ما مهم می دانیم، مانند قابلیت حرکت در کاوش‌های افق طولانی، توانایی تجزیه و تحلیل محیط و تعامل با اشیاء خارجی. کاربران درک جامعی از انعطاف‌پذیری ربات‌های قابل تنظیم مجدد و اثربخشی طرح یادگیری تقویتی ما دارند.

محققان به این نتیجه رسیدند که از نظر کارایی، الگوریتم درشت به ریز آن‌ها به‌طور مداوم در تمام وظایف از گزینه‌های جایگزین (به عنوان مثال، سیاست‌های فقط درشت یا ریز از ابتدا) بهتر عمل می‌کند.

مدتی طول می‌کشد تا ربات‌های تغییر شکل دهنده را در خارج از آزمایشگاه ببینیم، اما این کار گامی در مسیر درست است. محققان امیدوارند که این ربات به دیگر دانشمندان الهام بخشد تا ربات نرم قابل تنظیم مجدد خود را توسعه دهند که روزی بتواند بدن انسان را طی کند یا در یک دستگاه پوشیدنی گنجانده شود.

این مطالعه در وب سایت arXiv منتشر شد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار جدید تک‌ناک را از دست ندهید.