دانشمندان چینی در پژوهشی تازه ادعا کردهاند که برخی مدلهای پیشرفته هوش مصنوعی، بدون نیاز به آموزش مستقیم، قادر به درک جهان مشابه انسان هستند.
به گزارش تکناک، این تحقیق که توسط آکادمی علوم چین و دانشگاه صنعتی جنوب چین در گوانجو انجام شده است، نشان میدهد که مدلهای زبانی بزرگ (LLM) مانند ChatGPT و Gemini میتوانند اشیای طبیعی را به شکل مفهومی و خودانگیخته سازماندهی و طبقهبندی کنند؛ همانگونه که ذهن انسان عمل میکند.
در این مطالعه که نتایج آن در نشریه Nature Machine Intelligence منتشر شده است، پژوهشگران وظیفهای موسوم به “Odd-One-Out” را برای مدلها تعریف کردند؛ به این معنی که عنصری ناهماهنگ از میان مجموعهای از متون یا تصاویر مرتبط با ۱۸۵۴ شیء طبیعی مانند سگ، صندلی، سیب یا خودرو را انتخاب کنند. مدل ChatGPT-3.5 با استفاده از متن و مدل Gemini Pro Vision با استفاده از تصویر این وظیفه را انجام دادند.
نتیجه بهدستآمده شگفتانگیز بود: مدلها توانستند ۶۶ بُعد مفهومی برای دستهبندی اشیاء تولید کنند. این ابعاد نهتنها شامل مفاهیم ابتدایی مانند «غذا» یا «حیوان» میشد، بلکه ویژگیهای پیچیدهتری نظیر بافت، ارتباط احساسی، میزان مناسب بودن برای کودکان و حتی شرایط محیطی را نیز دربرمیگرفت.
یکی از نکات مهم این پژوهش آن است که مدلهای چندوجهی هوش مصنوعی، که توانایی پردازش همزمان متن و تصویر را دارند، عملکردی نزدیکتر به درک انسانی از خود نشان دادند. علاوه بر این، دادههای تصویربرداری مغزی نشان داد که واکنش مغز انسان به اشیا در برخی موارد با شیوه پردازش این مدلها همپوشانی دارد.

به گفته نویسندگان مقاله، این شباهت میتواند نشانهای از آن باشد که هوش مصنوعی نهفقط الگوها را تقلید میکند، بلکه به طور مفهومی و مستقل، جهان را به شیوهای مشابه انسان تحلیل مینماید.
با وجود یافتههای امیدوارکننده، محققان تأکید کردهاند که این شباهتها به معنای درک واقعی هوش مصنوعی مانند انسان نیست. هوش مصنوعی فاقد تجربه زیسته، درک حسی و تعامل فیزیکی با محیط است. مدلهای زبانی، در اصل، بر پایه الگوهای آماری استخراجشده از دادههای متنی و تصویری عمل میکنند و تجربه انسانی ندارند.
در این دیدگاه، LLMها بیشتر به آینهای از میلیونها کتاب و تصویر شباهت دارند، که بر اساس الگوهای آموختهشده، پاسخهایی بازتابی تولید میکنند و یک سیستم متفکر نیستند.
هرچند، این پژوهش دیدگاه سنتی درباره توانایی هوش مصنوعی در تقلید صرف از دادهها را به چالش میکشد. اگر این مدلها واقعاً به طور مستقل مفاهیم را شکل میدهند و جهان را دستهبندی میکنند، ممکن است انسان در آستانه ورود به عصر «هوش عمومی مصنوعی» (AGI) باشد؛ عصری که ماشینها میتوانند در حوزههای گوناگون، همچون انسان بیندیشند، تحلیل کنند و تصمیم بگیرند.
اگرچه هنوز راه زیادی تا تحقق کامل این هدف باقی مانده است، اما نتایج این مطالعه، گامی بلند در جهت شناخت بهتر ظرفیتهای واقعی هوش مصنوعی محسوب میشود.