OpenAI مدلی به نام CriticGPT را با هدف ارتقای صحت و قابلیت اطمینان ChatGPT و بررسی و یافتن ایرادها در پاسخهای این مدل زبانی معرفی کرده است.
بهگزارش تکناک، ChatGPT اواخر سال ۲۰۲۲ با سروصدای زیادی وارد دنیای تکنولوژی شد. این اتفاق آنقدر مهم بود که گوگل هم مجبور شد دستبهکار شود و ابزار هوش مصنوعی مولد متن خودش را معرفی کند. یکی از کارهایی که ChatGPT میتواند انجام دهد، نوشتن قطعات کد براساس دستورهای کاربر است.
نئووین مینویسد OpenAI مدل هوش مصنوعی مبتنیبر GPT-4 به نام CriticGPT را برای یافتن خطاها در خروجی کد ارائهشدهی این چتبات آموزش داده است. CriticGPT میتواند نقدهایی بنویسد تا نادرستیهای پاسخهای ChatGPT را برجسته کند.
درحالحاضر، CriticGPT بهصورت داخلی استفاده میشود. هدف از این مدل کمک به آموزشدهندههای هوش مصنوعی است. این آموزشدهندهها وظیفه دارند تا با استفاده از تکنیکی به نام «یادگیری تقویتی از بازخورد انسانی» (RLHF) پاسخهای GPT-4 را آموزش دهند و بهبود ببخشند. این تکنیک شامل ارزیابی پاسخهای مختلف ChatGPT بهواسطهی آموزشدهندههای هوش مصنوعی و مقایسهی آنها با یکدیگر است.
بااینحال، با دقیقترشدن ChatGPT و نامحسوسشدن اشتباههای آن، کار آموزشدهندههای هوش مصنوعی سختتر میشود. OpenAI میگوید:
این محدودیتی اساسی برای یادگیری تقویتی از بازخورد انسانی است و احتمال دارد همگامسازی مدلها را با افزایش تدریجی دانش آنها درمقایسهبا افرادی دشوارتر کند که میتوانند بازخورد ارائه دهند.
CriticGPT برای نجات وضعیت وارد کار میشود؛ اما همچنان نوعی مدل هوش مصنوعی است و پاسخهای آن ممکن است همیشه درست نباشد. این مدل مستعد مشکلات هوش مصنوعی مانند توهمزایی (Hallucination) نیز هست؛ بااینحال، CriticGPT میتواند به انسانها کمک کند تا درمقایسهبا زمانیکه بهتنهایی این کار را انجام میدهند، اشتباهها را بهتر تشخیص دهند.
بیشتر بخوانید:
CriticGPT همچنین با استفاده از یادگیری تقویتی از بازخورد انسانی آموزش دیده و وظیفهی تجزیهوتحلیل و نقد تعداد زیادی ورودی حاوی اشتباه به آن محول شده است. این مدل باید اشتباههای بهعمد واردشدهی انسان و باگهای طبیعی ChatGPT را پیدا میکرد که قبلاً آموزشدهنده شناسایی کرده بود. درحالحاضر، OpenAI مشغول کار روی رفع چند محدودیت CriticGPT است.
CriticGPT آموزش داده شده است تا پاسخهای کوتاه ChatGPT را بررسی کند؛ پس برای درک وظایف طولانی و پیچیدهی آموزشدهندهها، به توسعهی روشهای جدیدی نیاز است. توهمزاییهای CriticGPT میتواند باعث شود تا آموزشدهندهها اشتباههایی را در برچسبزدن قائل شوند که این مسئله پیامدهای منفی بهدنبال خواهد داشت.
درحالحاضر، CriticGPT برای یافتن خطاها در پاسخهای ChatGPT دید تیزبینانهای دارد. OpenAI اشاره میکند که اشتباههای دنیای واقعی میتوانند در بخشهای زیادی از پاسخ پراکنده شوند و این مسئلهای است که باید در آینده روی آن کار شود.