شرکت Physical Intelligence مدل هوش مصنوعی خود را معرفی کرد

شرکت Physical Intelligence (Pi) مدل هوش مصنوعی عمومی خود را برای صنعت رباتیک معرفی کرده است که می‌تواند به ماشین‌های موجود برای انجام خودکار کارهای مختلف کمک کند.

به گزارش تک‌ناک، استارت‌آپ نوظهور Physical Intelligence در سان فرانسیسکو به‌جای ساخت ربات، به دنبال ایجاد ماشین‌هایی است که با استفاده از هوش مصنوعی، به‌ طور خودکار وظایف دقیقی از جمله کارهای خانگی را انجام دهند.

این کارها شامل درآوردن و تا کردن لباس‌ها، بسته‌بندی دقیق تخم‌مرغ‌ها، آسیاب کردن دانه‌های قهوه و تمیز کردن میزها می‌شود. تصور کنید که در آینده‌ای نزدیک ربات‌هایی را در خانه ببینید که در حال جاروبرقی کشیدن، بسته‌بندی و باز کردن ماشین ظرفشویی، مرتب کردن تخت، بررسی یخچال و انباری برای فهرست کردن محتویات و حتی پختن شام هستند.

شرکت Physical Intelligence از مدل هوش مصنوعی خود رونمایی کرد

با این چشم‌انداز، شرکت Pi مدل پایه‌ای ربات چندمنظوره خود به نام π0 (پی-صفر) را معرفی می‌کند.

این شرکت توضیح داد: «ما معتقد هستیم این یک گام اولیه به سوی هدف بلندمدت ما در توسعه هوش فیزیکی مصنوعی است، به‌طوری که کاربران بتوانند به سادگی از ربات‌ها بخواهند هر وظیفه‌ای را که می‌خواهند درست مانند درخواست از مدل‌های زبان بزرگ (LLM) و دستیارهای چت‌بات، انجام دهند.»

این شرکت در ادامه بیان کرد: «مانند مدل‌های زبان بزرگ (LLM)، مدل ما روی داده‌های متنوعی آموزش دیده است و می‌تواند دستورات متنی مختلف را دنبال کند. اما بر خلاف LLMها، این مدل شامل تصاویر، متن و حرکات است و با یادگیری از تجربیات بدنی ربات‌ها، هوش فیزیکی را به‌دست می‌آورد. این قابلیت به آن امکان می‌دهد که به‌طور مستقیم دستورات سطح پایین را انجام دهد. این مدل می‌تواند انواع مختلفی از ربات‌ها را کنترل کند و برای انجام وظایف خاص یا تنظیم برای حالت‌های چالش‌برانگیز آماده شود.»

ربات پی-صفر نشان می‌دهد که چگونه می‌توان انواع کارهایی که نیاز به سطوح مختلفی از مهارت و حرکات دارند را توسط سخت‌افزار آموزش‌دیده به وسیله هوش مصنوعی انجام داد. در مجموع، مدل پایه، ۲۰ وظیفه را انجام داد که همه آنها نیاز به مهارت‌ها و دستکاری‌های مختلفی داشتند.

تیم توسعه‌دهنده این نوآوری اعلام کرد: «هدف ما از انتخاب این وظایف، حل مشکلات خاص نیست، بلکه فراهم کردن یک درک کلی از تعاملات فیزیکی برای مدل ما است، که پایه‌ای برای هوش فیزیکی خواهد بود.»

ربات‌های عمومی می‌توانند کارهای زیادی انجام دهند و با قابلیت یادگیری خود، با چالش‌های مختلف در دنیای فیزیکی تطبیق پیدا کنند و مهارت‌های خود را به‌طور مداوم توسعه دهند.

پی-صفر از یک مدل زبان-دیداری (VLM) که با داده‌های اینترنتی، پیش‌آموزش داده شده است، استفاده می‌کند تا حرکات خود را با یادگیری‌های هوش مصنوعی همگام کند. پیش‌آموزش شامل ۱۰,۰۰۰ ساعت داده درباره مهارت‌های دستکاری دقیق از هفت نوع مختلف ربات و ۶۸ وظیفه بود.

تیم توسعه‌دهنده می‌گوید که برای کنترل دقیق ربات‌ها، نیاز داریم که دستورات موتور را با سرعت بالا، تا ۵۰ بار در ثانیه، ارسال کنیم. برای رسیدن به این هدف، ما روشی جدید برای تقویت مدل‌های یادگیری زبان-دیداری (VLM) طراحی کردیم. این روش شامل استفاده از داده‌های مختلف ربات‌ها و یک مدل پیش‌آموزش داده شده بر اساس داده‌های اینترنتی است.

پژوهشگران می‌گویند که این بزرگ‌ترین ترکیب پیش‌آموزش است که تا کنون برای کنترل ربات‌ها استفاده شده است.

در حالی که شرکت هنوز در مراحل اولیه تحقیق و توسعه است، کارول هاوسمن، یکی از بنیانگذاران و مدیرعامل Pi معتقد است که مدل پایه‌ای آنها بر موانع موجود در زمینه تعمیم‌یابی غلبه خواهد کرد، که از جمله بر میزان زمان و هزینه مورد نیاز برای آموزش سخت‌افزار روی داده‌های دنیای فیزیکی برای یادگیری وظایف جدید غلبه می‌کند.

چشم‌انداز شرکت Pi بیشتر با نظرات آینده‌نگران اواسط قرن بیستم همخوانی دارد، چون دنیایی را می‌دیدند که ماشین‌ها زندگی ما را آسان‌تر می‌کنند.