CriticGPT برای یافتن ایراد در پاسخ‌های ChatGPT توسعه می‌یابد

OpenAI مدلی به نام CriticGPT را با هدف ارتقای صحت و قابلیت اطمینان ChatGPT و بررسی و یافتن ایرادها در پاسخ‌های این مدل زبانی معرفی کرده است.

به‌گزارش تک‌ناک، ChatGPT اواخر سال ۲۰۲۲ با سر‌و‌صدای زیادی وارد دنیای تکنولوژی شد. این اتفاق آن‌قدر مهم بود که گوگل هم مجبور شد دست‌به‌کار شود و ابزار هوش مصنوعی مولد متن خودش را معرفی کند. یکی از کارهایی که ChatGPT می‌تواند انجام دهد، نوشتن قطعات کد بر‌اساس دستورهای کاربر است.

نئووین می‌نویسد OpenAI مدل هوش مصنوعی مبتنی‌بر GPT-4 به نام CriticGPT را برای یافتن خطاها در خروجی کد ارائه‌شده‌ی این چت‌بات آموزش داده است. CriticGPT می‌تواند نقدهایی بنویسد تا نادرستی‌های پاسخ‌های ChatGPT را برجسته کند.

در‌حال‌حاضر، CriticGPT به‌صورت داخلی استفاده می‌شود. هدف از این مدل کمک به آموزش‌دهنده‌های هوش مصنوعی است. این آموزش‌دهنده‌ها وظیفه دارند تا با استفاده از تکنیکی به نام «یادگیری تقویتی از بازخورد انسانی» (RLHF) پاسخ‌های GPT-4 را آموزش دهند و بهبود ببخشند. این تکنیک شامل ارزیابی پاسخ‌های مختلف ChatGPT به‌واسطه‌ی آموزش‌دهنده‌های هوش مصنوعی و مقایسه‌ی آن‌ها با یکدیگر است.

بااین‌حال، با دقیق‌تر‌شدن ChatGPT و نامحسوس‌شدن اشتباه‌های آن، کار آموزش‌دهنده‌های هوش مصنوعی سخت‌تر می‌شود. OpenAI می‌گوید:

این محدودیتی اساسی برای یادگیری تقویتی از بازخورد انسانی است و احتمال دارد همگام‌سازی مدل‌ها را با افزایش تدریجی دانش آن‌ها درمقایسه‌با افرادی دشوارتر کند که می‌توانند بازخورد ارائه دهند.

CriticGPT برای نجات وضعیت وارد کار می‌شود؛ اما همچنان نوعی مدل هوش مصنوعی است و پاسخ‌های آن ممکن است همیشه درست نباشد. این مدل مستعد مشکلات هوش مصنوعی مانند توهم‌زایی (Hallucination) نیز هست؛ با‌این‌حال، CriticGPT می‌تواند به انسان‌ها کمک کند تا در‌مقایسه‌با زمانی‌که به‌تنهایی این کار را انجام می‌دهند، اشتباه‌ها را بهتر تشخیص دهند.

بیشتر بخوانید:
این ابزار هوشمند مراقب گیاهان آپارتمانی شما است

CriticGPT همچنین با استفاده از یادگیری تقویتی از بازخورد انسانی آموزش دیده و وظیفه‌ی تجزیه‌و‌تحلیل و نقد تعداد زیادی ورودی حاوی اشتباه به آن محول شده است. این مدل باید اشتباه‌های به‌عمد وارد‌شده‌ی انسان و باگ‌های طبیعی ChatGPT را پیدا می‌کرد که قبلاً آموزش‌دهنده شناسایی کرده بود. در‌حال‌حاضر، OpenAI مشغول کار روی رفع چند محدودیت CriticGPT است.

CriticGPT آموزش داده شده است تا پاسخ‌های کوتاه ChatGPT را بررسی کند؛ پس برای درک وظایف طولانی و پیچیده‌ی آموزش‌دهنده‌ها، به توسعه‌ی روش‌های جدیدی نیاز است. توهم‌زایی‌های CriticGPT می‌تواند باعث شود تا آموزش‌دهنده‌ها اشتباه‌هایی را در برچسب‌زدن قائل شوند که این مسئله پیامدهای منفی به‌دنبال خواهد داشت.

در‌حال‌حاضر، CriticGPT برای یافتن خطاها در پاسخ‌های ChatGPT دید تیزبینانه‌ای دارد. OpenAI اشاره می‌کند که اشتباه‌های دنیای واقعی می‌توانند در بخش‌های زیادی از پاسخ پراکنده شوند و این مسئله‌ای است که باید در آینده روی آن کار شود.