• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

امیرحسین یونس نوشته شده توسط امیرحسین یونس
چهارشنبه 9 آبان 1403 - 18:25
در اخبار هوش مصنوعی
مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. تحلیل رفتار داخلی مدل‌های زبانی بزرگ
  • 2. نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی
  • 3. طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها
  • 4. صداقت مهارت‌محور و توانایی تعمیم مدل‌ها
  • 5. تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها
  • 6. پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

مطالعه جدید نشان می‌دهد که مدل‌های زبانی بزرگ (LLM) هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند تا قابلیت اطمینان در تولید متن بهبود یابد.

به‌گزارش تک‌ناک، پژوهش جدید محققان مؤسسه تکنیکون و گوگل ریسرچ و اپل نشان می‌دهد مدل‌های زبانی بزرگ (LLMs) از توانایی شناسایی خطاهای خود برخوردارند. این مطالعه حاکی از آن است که مدل‌های زبانی بیش از آنچه پیش‌تر تصور می‌شد، درک عمیق‌تری از صداقت پاسخ‌هایشان دارند.

مدل‌های زبانی بزرگ مانند ChatGPT و BERT به‌دلیل تمایل به تولید پاسخ‌های نادرست یا بی‌معنی که به آن‌ها «توهمات» گفته می‌شود، همواره با انتقاد روبه‌رو بوده‌اند. اصطلاح توهم فاقد تعریف واحدی است و طیف گسترده‌ای از خطاها را در‌بر می‌گیرد؛ از‌جمله نادرستی‌های واقعی، تعصبات، شکست‌های منطقی در استدلال و دیگر خطاهای دنیای واقعی. در این تحقیق، محققان این مفهوم را به‌عنوان تمامی خطاهای تولیدی مدل در نظر گرفتند.

01
از 06
تحلیل رفتار داخلی مدل‌های زبانی بزرگ

ونچربیت می‌نویسد که تا به امروز بیشتر تحقیقات در‌زمینه‌ توهمات مدل‌های زبانی بر رفتار خارجی آن‌ها و تحلیل برداشت کاربران از این خطاها متمرکز بود. این روش‌ها درک برخی جنبه‌های خطاهای مدل‌ها را ممکن می‌کرد؛ اما بینش محدودی درباره نحوه پردازش و رمزگذاری خطاها در داخل مدل‌ها ارائه می‌داد. در‌مقابل، پژوهش جدید با بررسی دقیق فعالیت‌های داخلی مدل‌ها نشان داد که مدل‌های زبانی بزرگ سیگنال‌های مرتبط با صداقت و درستی را در پاسخ‌های خود رمزگذاری می‌کنند.

برخلاف تلاش‌های پیشین که تنها بر تازه‌ترین توکن تولید‌شده یا توکن ورودی مدل‌ها متمرکز بودند، این تحقیق جدید به‌جای تمرکز صرف بر خروجی نهایی،توکن‌های خاص پاسخ را بررسی می‌کند که تغییر آن‌ها می‌تواند درستی پاسخ را تغییر دهد. محققان این شیوه را «توکن‌های پاسخ دقیق» نام‌گذاری کرده‌اند. این رویکرد به آن‌ها اجازه داد تا اطلاعات جامع‌تری از نحوه پردازش صداقت مدل‌ها در جریان تولید پاسخ‌ها به‌دست آورند.

تشخیص و اصلاح اشتباه مدل‌های زبانی بزرگ توسط خود

02
از 06
نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی

پژوهشگران آزمایش‌های خود را روی چهار نسخه از مدل‌های Mistral 7B و Llama 2 انجام دادند. این مدل‌ها روی ۱۰ مجموعه داده مختلف شامل وظایفی نظیر پاسخ به پرسش‌ها، استنتاج زبانی طبیعی، حل مسئله ریاضی و تحلیل احساسات آزمایش شدند. آن‌ها برای شبیه‌سازی استفاده واقعی به مدل‌ها اجازه دادند پاسخ‌هایی بدون محدودیت تولید کنند. یافته‌ها نشان داد که اطلاعات مربوط به صداقت پاسخ‌ها عمدتاً در توکن‌های پاسخ دقیق متمرکز شده است.

این الگوهای صداقت در تقریباً تمامی مجموعه داده‌ها و مدل‌ها ثابت ماند. محققان دراین‌باره می‌گویند:

این نتایج نشان‌دهنده مکانیسم عمومی در مدل‌های زبانی بزرگ است که طی آن مدل‌ها اطلاعات مرتبط با صداقت و درستی را در جریان تولید متن پردازش و رمزگذاری می‌کنند.

03
از 06
طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها

محققان در این مطالعه از طبقه‌بندهایی با عنوان «طبقه‌بندهای جست‌وجوگر» استفاده کردند. این طبقه‌بندها که به‌طور خاص برای تشخیص ویژگی‌های مرتبط با صداقت خروجی‌های تولید‌شده طراحی شده‌اند، با توجه به فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌توانند خطاها را پیش‌بینی کنند. آزمایش‌ها نشان داد که آموزش این طبقه‌بندی‌ها با استفاده از توکن‌های پاسخ دقیق می‌تواند دقت در تشخیص خطاها را بسیار افزایش دهد.

04
از 06
صداقت مهارت‌محور و توانایی تعمیم مدل‌ها

پژوهش یادشده نشان داد که مدل‌های زبانی بزرگ صداقت را به‌صورت «مهارت‌محور» رمزگذاری می‌کنند. این یعنی طبقه‌بندهای جست‌وجوگر، تنها در‌زمینه وظایفی با نیازهای مهارتی مشابه مانند بازیابی واقعیات یا استدلال منطقی، می‌توانند عملکرد خود را تعمیم دهند؛؛ اما در وظایف متفاوت نظیر تحلیل احساسات توانایی تعمیم ندارند. محققان این یافته را به‌عنوان ویژگی مهم مدل‌ها ارزیابی کردند و نشان دادند که مدل‌ها برای هر مجموعه از مهارت‌ها جداگانه سیگنال‌های مرتبط با صداقت را پردازش و ذخیره می‌کنند.

05
از 06
تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها

تحلیل‌های این پژوهش تفاوت شگفت‌آوری را بین فعالیت‌های داخلی مدل‌ها و پاسخ‌های نهایی آن‌ها نشان داد. در نمونه‌هایی مشاهده شد که مدل‌ها با وجود رمزگذاری پاسخ درست در فعالیت‌های داخلی خود، پاسخی نادرست تولید می‌کنند. این یافته حاکی از آن است که روش‌های ارزیابی فعلی که تنها بر خروجی نهایی مدل‌ها متکی هستند، ممکن است نتوانند به‌درستی قابلیت‌های واقعی آن‌ها را منعکس کنند.

به‌گفته محققان، این تفاوت نشان می‌دهد که با درک و استفاده بهتر از اطلاعات داخلی مدل‌ها، می‌توان به توانایی‌های پنهان آن‌ها دست یافت و نرخ خطاها را بسیار کاهش داد.

06
از 06
پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

این یافته‌ها می‌تواند به طراحی سیستم‌های جدیدی برای کاهش توهمات در مدل‌های زبانی کمک کند؛ هرچند این تکنیک‌ها عمدتاً در مدل‌های منبع‌باز کاربرد دارند که دسترسی به فعالیت‌های داخلی آن‌ها امکان‌پذیر است. ازیک‌سو، تحلیل فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌تواند به توسعه تکنیک‌های مؤثرتری برای شناسایی و کاهش خطا کمک کند و از‌سوی‌دیگر، به‌عنوان بخشی از تحقیقات وسیع‌تر درک بهتری از فرایندهای داخلی مدل‌های زبانی بزرگ ارائه دهد.

آزمایشگاه‌های پیشرو هوش مصنوعی نظیر OpenAI و آنتروپیک و دیپ‌مایند گوگل نیز با روش‌های متفاوت عملکرد داخلی مدل‌ها را مطالعه کرده‌اند. این مطالعات در‌مجموع می‌تواند به ساخت مدل‌های زبانی با قابلیت‌های پیشرفته‌تر و سیستم‌های هوشمندتر و مطمئن‌تر کمک کند. محققان در‌این‌باره نوشتند:

«یافته‌های ما نشان می‌دهد که نمایش‌های داخلی مدل‌های زبانی بزرگ بینش‌های مفیدی در‌زمینه خطاهای آن‌ها فراهم و پیچیدگی پیوند بین فرایندهای داخلی مدل‌ها و خروجی‌های خارجی را برجسته می‌کند. امیدواریم راهی برای بهبود بیشتر در تشخیص و کاهش خطاها وجود داشته باشد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

جمنای امکان جست‌وجوی اپلیکیشن و بازی را در گوگل پلی فراهم کرد
اخبار هوش مصنوعی

جمنای امکان جست‌وجوی اپلیکیشن و بازی را در گوگل پلی فراهم کرد

نوشته شده توسط ساینا چمنی
7 تیر 1405
دولت آمریکا، متا را برای ارزیابی امنیتی هوش مصنوعی تحت فشار گذاشت
اخبار هوش مصنوعی

دولت آمریکا، متا را برای ارزیابی امنیتی هوش مصنوعی تحت فشار گذاشت

نوشته شده توسط مانی
7 تیر 1405
رقابت استارت‌آپ‌های آسیایی با مدل‌های هوش مصنوعی آمریکایی در سایه تحریم‌ها
اخبار هوش مصنوعی

رقابت استارت‌آپ‌های آسیایی با مدل‌های هوش مصنوعی آمریکایی در سایه تحریم‌ها

نوشته شده توسط مانی
7 تیر 1405
ادوبی و Topaz Labs
اخبار هوش مصنوعی

معامله مهم در دنیای خلاقیت؛ ادوبی Topaz Labs را می‌خرد

نوشته شده توسط مانی
6 تیر 1405
مایکروسافت مدل کدنویسی Flash را به کوپایلت آورد
اخبار هوش مصنوعی

مایکروسافت مدل کدنویسی Flash را به کوپایلت آورد

نوشته شده توسط تارخ ترهنده
6 تیر 1405
خبر بعدی
جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

هیوندای النترا 2027 با طراحی کاملا جدید معرفی شد

هیوندای النترا 2027 با طراحی کاملا جدید معرفی شد + تصویر

6 تیر 1405
ذخیره ساز تحت شبکه

ذخیره‌ساز تحت شبکه یا NAS چیست و چه کاربردهایی دارد؟

3 تیر 1405

داغ‌ترین‌های روز

بهترین سیستم گیمینگ

بهترین سیستم گیمینگ بازار ایران ؛ معرفی ۷ PC گیمینگ از اقتصادی تا RTX 5090

5 تیر 1405 - به‌روزشده در 6 تیر 1405
نسخه بتای One UI 9 به گوشی‌های میان‌رده گلکسی رسید

نسخه بتای One UI 9 به گوشی‌های میان‌رده گلکسی رسید

7 تیر 1405
اولین دوچرخه برقی خورشیدی جهان با برد ۱۹۳ کیلومتری معرفی شد

اولین دوچرخه برقی خورشیدی جهان با برد ۱۹۳ کیلومتری معرفی شد + تصویر

2 تیر 1405
مقایسه پوکو X8 Pro با گلکسی A57

مقایسه گوشی پوکو X8 Pro با گلکسی A57؛ کدام ارزش خرید بیشتری دارد؟

5 تیر 1405 - به‌روزشده در 6 تیر 1405
اولین هتل کاملا رباتیک جهان در چین افتتاح می‌ شود

اولین هتل کاملا رباتیک جهان در چین افتتاح می‌ شود

6 تیر 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

افشای جزئیات آیفون اولترا 2 و وضعیت نامعلوم آیفون ایر 3

افشای جزئیات آیفون اولترا 2 و وضعیت نامعلوم آیفون ایر 3

7 تیر 1405
تبلت Moto Pad 70 Pro با نمایشگر 144 هرتز و تراشه Snapdragon 8s Gen 4

تبلت Moto Pad 70 Pro با نمایشگر 144 هرتز معرفی شد

7 تیر 1405
روایت رسانه آمریکایی از پشت پرده حمله سایبری به بانک‌های ایران

روایت رسانه آمریکایی از پشت پرده حمله سایبری به بانک‌های ایران

7 تیر 1405
چرا زمین‌لرزه های ونزوئلا این‌قدر ویرانگر بودند؟

چرا زمین‌لرزه های ونزوئلا این‌قدر ویرانگر بودند؟

7 تیر 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir