محققان MIT و دانشگاه واشنگتن با کمک هوش مصنوعی روش جدیدی برای مدلسازی رفتار انسان و ماشین توسعه دادهاند که محدودیتهای محاسباتی را در نظر میگیرد.
بهگزارش تکناک، برای ساخت سیستمهای هوش مصنوعی که بتوانند بهطور مؤثر با انسان همکاری کنند، ابتدا داشتن مدلی مناسب از رفتار انسان مفید است؛ اما انسانها هنگام تصمیمگیری به رفتار نامطلوب تمایل دارند. این غیرمنطقیبودن که مدلکردن آن دشوار است، اغلب به محدودیتهای محاسباتی خلاصه میشود. انسانها نمیتوانند دهها سال را برای فکرکردن به راهحل ایدئال مشکلی خاص صرف کنند.
فهرست مطالب
توسعه رویکرد مدلسازی جدید
پژوهشگران MIT و دانشگاه واشنگتن روشی را برای مدلسازی رفتار یک عامل، چه انسانی و چه ماشینی، توسعه دادهاند که محدودیتهای محاسباتی ناشناختهای را در نظر میگیرد که ممکن است توانایی حل مسئله عامل را محدود کند.
مدل دانشمندان میتواند با دیدن تنها چند ردپا از اقدامات قبلی یک عامل، بهطور خودکار محدودیتهای محاسباتی او را استنتاج کند. نتیجه که به آن «بودجه استنتاج عامل» گفته میشود، میتواند برای پیشبینی رفتارهای آینده آن عامل استفاده شود.
کاربردهای عملی و اعتبارسنجی مدل
پژوهشگران در مقالهای جدید نشان میدهند که چگونه میتوان از مسیرهای قبلی برای استنتاج اهداف مسیریابی فرد و پیشبینی حرکات بعدی بازیکنان در مسابقات شطرنج استفاده کرد. این روش با روشی دیگر که برای مدلسازی این نوع تصمیمگیری رایج است، برابری میکند یا از آن پیشی میگیرد.
درنهایت، این کار میتواند به دانشمندان کمک کند تا به سیستمهای هوش مصنوعی نحوه رفتار انسانها را بیاموزند و این امر به سیستمها کمک میکند تا بهتر به همکاران انسانی خود پاسخ دهند. بهگفته اتول پاول جیکوب، دانشجوی تحصیلات تکمیلی مهندسی برق و علوم کامپیوتر (EECS) و نویسنده اصلی مقالهای درباره این تکنیک، توانایی درک رفتار انسان و سپس استنتاج اهداف او از آن رفتار، میتواند دستیار هوش مصنوعی را بسیار مفیدتر کند.
جیکوب این مقاله را با همکاری آبشیک گوپتا، استادیار دانشگاه واشنگتن و نویسنده ارشد و جیکوب آندریاس، دانشیار EECS و عضو آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) نوشته است. این تحقیق در کنفرانس بینالمللی بازنمایی یادگیری ارائه خواهد شد.
مدلسازی رفتار
پژوهشگران چندین دهه است که مدلهای محاسباتی از رفتار انسان را میسازند. بسیاری از رویکردهای قبلی سعی میکنند با افزودن نویز به مدل، تصمیمگیری غیربهینه را در نظر بگیرند. بهجای اینکه عامل همیشه گزینه صحیح را انتخاب کند، ممکن است باعث شود آن عامل 95 درصد مواقع گزینه صحیح را انتخاب کند.
بااینحال، این روشها ممکن است نتوانند این واقعیت را نشان دهند که انسانها همیشه به همان شیوه رفتار غیربهینه عمل نمیکنند. دیگر محققان MIT نیز روشهای مؤثرتری را برای برنامهریزی و استنتاج اهداف در مواجهه با تصمیمگیری غیربهینه مطالعه کردهاند.
جیکوب و همکارانش برای ساختن مدل خود از مطالعات قبلی روی بازیکنان شطرنج الهام گرفتند. آنان متوجه شدند که بازیکنان هنگام انجام حرکات ساده، زمان کمتری را برای فکرکردن قبل از عمل صرف میکنند و بازیکنان قویتر درمقایسهبا بازیکنان ضعیفتر تمایل دارند در مسابقات چالشبرانگیز زمان بیشتری را صرف برنامهریزی کنند.
پژوهشگران چهارچوبی ساختند که میتوانست عمق برنامهریزی یک عامل را از اقدامات قبلی استنتاج و از آن اطلاعات برای مدلسازی فرایند تصمیمگیری عامل استفاده کند. اولین قدم در روش آنان شامل اجرای الگوریتمی برای مدتزمان معین برای حل مشکل در حال مطالعه است. برای مثال، اگر آنان در حال مطالعه مسابقه شطرنج باشند، ممکن است اجازه دهند الگوریتم بازی شطرنج برای تعداد معینی از مراحل اجرا شود. درنهایت، محققان میتوانند تصمیماتی را ببینند که الگوریتم در هر مرحله اتخاذ کرده است.
مدل دانشمندان این تصمیمگیریها را با رفتار هوشمندی مقایسه میکند که همان مشکل را حل میکند. این مدل تصمیمات هوش مصنوعی را با تصمیمات الگوریتم هماهنگ و مرحلهای را شناسایی میکند که هوش مصنوعی در آن برنامهریزی را متوقف کرده است.
از این طریق، مدل میتواند میزان بودجه استنتاج عامل یا مدتزمانی را تعیین کند که آن عامل برای حل این مشکل برنامهریزی میکند. همچنین، میتواند از بودجه استنتاج برای پیشبینی واکنش آن عامل هنگام حل مشکلی مشابه استفاده کند.
راهحلی تفسیرشدنی
این روش مدلسازی رفتار انسان میتواند بسیار کارآمد باشد؛ زیرا محققان میتوانند بدون انجام کار اضافی به کل مجموعه تصمیمات گرفتهشده الگوریتم حل مسئله دسترسی داشته باشند. این چهارچوب میتواند برای هر مشکلی اعمال شود که با کلاسی خاص از الگوریتمها حلشدنی باشد.
محققان رویکرد خود را در سه کار مدلسازی مختلف آزمایش کردند: ۱. استنتاج اهداف پیمایش از مسیرهای قبلی؛ ۲. حدسزدن قصد ارتباطی فرد از نشانههای کلامی او؛ ۳. پیشبینی حرکات بعدی در مسابقات شطرنج انسان با انسان.
روش آنان در هر آزمایش، عملکردی برابر یا بهتری از روش جایگزین محبوب نشان داد. علاوهبراین، محققان دریافتند که مدل آنها از رفتار انسان با معیارهای مهارت بازیکن (در مسابقات شطرنج) و دشواری کار مطابقت مطلوبی دارد.
در آینده، محققان میخواهند از این رویکرد برای مدلسازی فرایند برنامهریزی در سایر حوزهها، مانند یادگیری تقویتی استفاده کنند؛ روشی براساس آزمونوخطا که معمولاً در رباتیک استفاده میشود. در درازمدت، آنان قصد دارند با تکیه بر این کار، بهسمت هدف بزرگتر توسعه هوش مصنوعی مؤثرتر حرکت کنند.