شرکت Physical Intelligence (Pi) مدل هوش مصنوعی عمومی خود را برای صنعت رباتیک معرفی کرده است که میتواند به ماشینهای موجود برای انجام خودکار کارهای مختلف کمک کند.
به گزارش تکناک، استارتآپ نوظهور Physical Intelligence در سان فرانسیسکو بهجای ساخت ربات، به دنبال ایجاد ماشینهایی است که با استفاده از هوش مصنوعی، به طور خودکار وظایف دقیقی از جمله کارهای خانگی را انجام دهند.
این کارها شامل درآوردن و تا کردن لباسها، بستهبندی دقیق تخممرغها، آسیاب کردن دانههای قهوه و تمیز کردن میزها میشود. تصور کنید که در آیندهای نزدیک رباتهایی را در خانه ببینید که در حال جاروبرقی کشیدن، بستهبندی و باز کردن ماشین ظرفشویی، مرتب کردن تخت، بررسی یخچال و انباری برای فهرست کردن محتویات و حتی پختن شام هستند.
با این چشمانداز، شرکت Pi مدل پایهای ربات چندمنظوره خود به نام π0 (پی-صفر) را معرفی میکند.
این شرکت توضیح داد: «ما معتقد هستیم این یک گام اولیه به سوی هدف بلندمدت ما در توسعه هوش فیزیکی مصنوعی است، بهطوری که کاربران بتوانند به سادگی از رباتها بخواهند هر وظیفهای را که میخواهند درست مانند درخواست از مدلهای زبان بزرگ (LLM) و دستیارهای چتبات، انجام دهند.»
این شرکت در ادامه بیان کرد: «مانند مدلهای زبان بزرگ (LLM)، مدل ما روی دادههای متنوعی آموزش دیده است و میتواند دستورات متنی مختلف را دنبال کند. اما بر خلاف LLMها، این مدل شامل تصاویر، متن و حرکات است و با یادگیری از تجربیات بدنی رباتها، هوش فیزیکی را بهدست میآورد. این قابلیت به آن امکان میدهد که بهطور مستقیم دستورات سطح پایین را انجام دهد. این مدل میتواند انواع مختلفی از رباتها را کنترل کند و برای انجام وظایف خاص یا تنظیم برای حالتهای چالشبرانگیز آماده شود.»
ربات پی-صفر نشان میدهد که چگونه میتوان انواع کارهایی که نیاز به سطوح مختلفی از مهارت و حرکات دارند را توسط سختافزار آموزشدیده به وسیله هوش مصنوعی انجام داد. در مجموع، مدل پایه، ۲۰ وظیفه را انجام داد که همه آنها نیاز به مهارتها و دستکاریهای مختلفی داشتند.
تیم توسعهدهنده این نوآوری اعلام کرد: «هدف ما از انتخاب این وظایف، حل مشکلات خاص نیست، بلکه فراهم کردن یک درک کلی از تعاملات فیزیکی برای مدل ما است، که پایهای برای هوش فیزیکی خواهد بود.»
رباتهای عمومی میتوانند کارهای زیادی انجام دهند و با قابلیت یادگیری خود، با چالشهای مختلف در دنیای فیزیکی تطبیق پیدا کنند و مهارتهای خود را بهطور مداوم توسعه دهند.
پی-صفر از یک مدل زبان-دیداری (VLM) که با دادههای اینترنتی، پیشآموزش داده شده است، استفاده میکند تا حرکات خود را با یادگیریهای هوش مصنوعی همگام کند. پیشآموزش شامل ۱۰,۰۰۰ ساعت داده درباره مهارتهای دستکاری دقیق از هفت نوع مختلف ربات و ۶۸ وظیفه بود.
تیم توسعهدهنده میگوید که برای کنترل دقیق رباتها، نیاز داریم که دستورات موتور را با سرعت بالا، تا ۵۰ بار در ثانیه، ارسال کنیم. برای رسیدن به این هدف، ما روشی جدید برای تقویت مدلهای یادگیری زبان-دیداری (VLM) طراحی کردیم. این روش شامل استفاده از دادههای مختلف رباتها و یک مدل پیشآموزش داده شده بر اساس دادههای اینترنتی است.
پژوهشگران میگویند که این بزرگترین ترکیب پیشآموزش است که تا کنون برای کنترل رباتها استفاده شده است.
در حالی که شرکت هنوز در مراحل اولیه تحقیق و توسعه است، کارول هاوسمن، یکی از بنیانگذاران و مدیرعامل Pi معتقد است که مدل پایهای آنها بر موانع موجود در زمینه تعمیمیابی غلبه خواهد کرد، که از جمله بر میزان زمان و هزینه مورد نیاز برای آموزش سختافزار روی دادههای دنیای فیزیکی برای یادگیری وظایف جدید غلبه میکند.
چشمانداز شرکت Pi بیشتر با نظرات آیندهنگران اواسط قرن بیستم همخوانی دارد، چون دنیایی را میدیدند که ماشینها زندگی ما را آسانتر میکنند.