• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

امیرحسین یونس نوشته شده توسط امیرحسین یونس
چهارشنبه 9 آبان 1403 - 18:25
در اخبار هوش مصنوعی
مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. تحلیل رفتار داخلی مدل‌های زبانی بزرگ
  • 2. نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی
  • 3. طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها
  • 4. صداقت مهارت‌محور و توانایی تعمیم مدل‌ها
  • 5. تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها
  • 6. پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

مطالعه جدید نشان می‌دهد که مدل‌های زبانی بزرگ (LLM) هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند تا قابلیت اطمینان در تولید متن بهبود یابد.

به‌گزارش تک‌ناک، پژوهش جدید محققان مؤسسه تکنیکون و گوگل ریسرچ و اپل نشان می‌دهد مدل‌های زبانی بزرگ (LLMs) از توانایی شناسایی خطاهای خود برخوردارند. این مطالعه حاکی از آن است که مدل‌های زبانی بیش از آنچه پیش‌تر تصور می‌شد، درک عمیق‌تری از صداقت پاسخ‌هایشان دارند.

مدل‌های زبانی بزرگ مانند ChatGPT و BERT به‌دلیل تمایل به تولید پاسخ‌های نادرست یا بی‌معنی که به آن‌ها «توهمات» گفته می‌شود، همواره با انتقاد روبه‌رو بوده‌اند. اصطلاح توهم فاقد تعریف واحدی است و طیف گسترده‌ای از خطاها را در‌بر می‌گیرد؛ از‌جمله نادرستی‌های واقعی، تعصبات، شکست‌های منطقی در استدلال و دیگر خطاهای دنیای واقعی. در این تحقیق، محققان این مفهوم را به‌عنوان تمامی خطاهای تولیدی مدل در نظر گرفتند.

01
از 06
تحلیل رفتار داخلی مدل‌های زبانی بزرگ

ونچربیت می‌نویسد که تا به امروز بیشتر تحقیقات در‌زمینه‌ توهمات مدل‌های زبانی بر رفتار خارجی آن‌ها و تحلیل برداشت کاربران از این خطاها متمرکز بود. این روش‌ها درک برخی جنبه‌های خطاهای مدل‌ها را ممکن می‌کرد؛ اما بینش محدودی درباره نحوه پردازش و رمزگذاری خطاها در داخل مدل‌ها ارائه می‌داد. در‌مقابل، پژوهش جدید با بررسی دقیق فعالیت‌های داخلی مدل‌ها نشان داد که مدل‌های زبانی بزرگ سیگنال‌های مرتبط با صداقت و درستی را در پاسخ‌های خود رمزگذاری می‌کنند.

برخلاف تلاش‌های پیشین که تنها بر تازه‌ترین توکن تولید‌شده یا توکن ورودی مدل‌ها متمرکز بودند، این تحقیق جدید به‌جای تمرکز صرف بر خروجی نهایی،توکن‌های خاص پاسخ را بررسی می‌کند که تغییر آن‌ها می‌تواند درستی پاسخ را تغییر دهد. محققان این شیوه را «توکن‌های پاسخ دقیق» نام‌گذاری کرده‌اند. این رویکرد به آن‌ها اجازه داد تا اطلاعات جامع‌تری از نحوه پردازش صداقت مدل‌ها در جریان تولید پاسخ‌ها به‌دست آورند.

تشخیص و اصلاح اشتباه مدل‌های زبانی بزرگ توسط خود

02
از 06
نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی

پژوهشگران آزمایش‌های خود را روی چهار نسخه از مدل‌های Mistral 7B و Llama 2 انجام دادند. این مدل‌ها روی ۱۰ مجموعه داده مختلف شامل وظایفی نظیر پاسخ به پرسش‌ها، استنتاج زبانی طبیعی، حل مسئله ریاضی و تحلیل احساسات آزمایش شدند. آن‌ها برای شبیه‌سازی استفاده واقعی به مدل‌ها اجازه دادند پاسخ‌هایی بدون محدودیت تولید کنند. یافته‌ها نشان داد که اطلاعات مربوط به صداقت پاسخ‌ها عمدتاً در توکن‌های پاسخ دقیق متمرکز شده است.

این الگوهای صداقت در تقریباً تمامی مجموعه داده‌ها و مدل‌ها ثابت ماند. محققان دراین‌باره می‌گویند:

این نتایج نشان‌دهنده مکانیسم عمومی در مدل‌های زبانی بزرگ است که طی آن مدل‌ها اطلاعات مرتبط با صداقت و درستی را در جریان تولید متن پردازش و رمزگذاری می‌کنند.

03
از 06
طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها

محققان در این مطالعه از طبقه‌بندهایی با عنوان «طبقه‌بندهای جست‌وجوگر» استفاده کردند. این طبقه‌بندها که به‌طور خاص برای تشخیص ویژگی‌های مرتبط با صداقت خروجی‌های تولید‌شده طراحی شده‌اند، با توجه به فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌توانند خطاها را پیش‌بینی کنند. آزمایش‌ها نشان داد که آموزش این طبقه‌بندی‌ها با استفاده از توکن‌های پاسخ دقیق می‌تواند دقت در تشخیص خطاها را بسیار افزایش دهد.

04
از 06
صداقت مهارت‌محور و توانایی تعمیم مدل‌ها

پژوهش یادشده نشان داد که مدل‌های زبانی بزرگ صداقت را به‌صورت «مهارت‌محور» رمزگذاری می‌کنند. این یعنی طبقه‌بندهای جست‌وجوگر، تنها در‌زمینه وظایفی با نیازهای مهارتی مشابه مانند بازیابی واقعیات یا استدلال منطقی، می‌توانند عملکرد خود را تعمیم دهند؛؛ اما در وظایف متفاوت نظیر تحلیل احساسات توانایی تعمیم ندارند. محققان این یافته را به‌عنوان ویژگی مهم مدل‌ها ارزیابی کردند و نشان دادند که مدل‌ها برای هر مجموعه از مهارت‌ها جداگانه سیگنال‌های مرتبط با صداقت را پردازش و ذخیره می‌کنند.

05
از 06
تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها

تحلیل‌های این پژوهش تفاوت شگفت‌آوری را بین فعالیت‌های داخلی مدل‌ها و پاسخ‌های نهایی آن‌ها نشان داد. در نمونه‌هایی مشاهده شد که مدل‌ها با وجود رمزگذاری پاسخ درست در فعالیت‌های داخلی خود، پاسخی نادرست تولید می‌کنند. این یافته حاکی از آن است که روش‌های ارزیابی فعلی که تنها بر خروجی نهایی مدل‌ها متکی هستند، ممکن است نتوانند به‌درستی قابلیت‌های واقعی آن‌ها را منعکس کنند.

به‌گفته محققان، این تفاوت نشان می‌دهد که با درک و استفاده بهتر از اطلاعات داخلی مدل‌ها، می‌توان به توانایی‌های پنهان آن‌ها دست یافت و نرخ خطاها را بسیار کاهش داد.

06
از 06
پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

این یافته‌ها می‌تواند به طراحی سیستم‌های جدیدی برای کاهش توهمات در مدل‌های زبانی کمک کند؛ هرچند این تکنیک‌ها عمدتاً در مدل‌های منبع‌باز کاربرد دارند که دسترسی به فعالیت‌های داخلی آن‌ها امکان‌پذیر است. ازیک‌سو، تحلیل فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌تواند به توسعه تکنیک‌های مؤثرتری برای شناسایی و کاهش خطا کمک کند و از‌سوی‌دیگر، به‌عنوان بخشی از تحقیقات وسیع‌تر درک بهتری از فرایندهای داخلی مدل‌های زبانی بزرگ ارائه دهد.

آزمایشگاه‌های پیشرو هوش مصنوعی نظیر OpenAI و آنتروپیک و دیپ‌مایند گوگل نیز با روش‌های متفاوت عملکرد داخلی مدل‌ها را مطالعه کرده‌اند. این مطالعات در‌مجموع می‌تواند به ساخت مدل‌های زبانی با قابلیت‌های پیشرفته‌تر و سیستم‌های هوشمندتر و مطمئن‌تر کمک کند. محققان در‌این‌باره نوشتند:

«یافته‌های ما نشان می‌دهد که نمایش‌های داخلی مدل‌های زبانی بزرگ بینش‌های مفیدی در‌زمینه خطاهای آن‌ها فراهم و پیچیدگی پیوند بین فرایندهای داخلی مدل‌ها و خروجی‌های خارجی را برجسته می‌کند. امیدواریم راهی برای بهبود بیشتر در تشخیص و کاهش خطاها وجود داشته باشد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

دقت بهترین مدل هوش مصنوعی تنها ۶۹ درصد است
اخبار هوش مصنوعی

دقت بهترین مدل هوش مصنوعی تنها ۶۹ درصد است

نوشته شده توسط سید محمد برازنده
23 آذر 1404
یک‌چهارم نوجوانان برای حمایت روانی به چت‌بات‌های هوش مصنوعی روی آورده‌اند
اخبار هوش مصنوعی

یک‌چهارم نوجوانان برای حمایت روانی به چت‌بات‌های هوش مصنوعی روی آورده‌اند

نوشته شده توسط مانی
23 آذر 1404
اینتل استراتژی هوش مصنوعی خود را تغییر می دهد
اخبار هوش مصنوعی

اینتل استراتژی هوش مصنوعی خود را تغییر می دهد

نوشته شده توسط سید محمد برازنده
22 آذر 1404
گوگل قابلیت «نشانه‌گذاری روی تصویر» را در جمنای آزمایش می‌ کند
اخبار هوش مصنوعی

گوگل قابلیت «نشانه‌گذاری روی تصویر» را در جمنای آزمایش می‌ کند

نوشته شده توسط سید محمد برازنده
22 آذر 1404
کمبود نیرو، ترمز غول‌های هوش مصنوعی را کشید
اخبار هوش مصنوعی

کمبود نیرو، ترمز غول‌های هوش مصنوعی را کشید

نوشته شده توسط سید محمد برازنده
22 آذر 1404
خبر بعدی
جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

نور آبی گوشی چیست و چگونه بر خواب و بینایی تأثیر می‌گذارد؟

25 آبان 1404
گندم خودبارور آینده کشاورزی را متحول می‌ کند

گندم خودبارور آینده کشاورزی را متحول می‌ کند

10 آذر 1404

داغ‌ترین‌های روز

ساعت های کاسیو

پرفروش‌ترین و گران‌ترین ساعت های کاسیو؛ از جی‌شاک تا ادیفایس

16 آذر 1404
ریپل

مدیرعامل ریپل: سرعت رشد صندوق‌های ریپل نشان‌دهنده یک تغییر بزرگ در بازار است

18 آذر 1404
تاریخ تحویل اولین محموله هواپیمای سوخو-۳۵ به ایران مشخص شد

تاریخ تحویل اولین محموله هواپیمای سوخو-۳۵ به ایران مشخص شد

16 آذر 1404
تحلیلگر سرشناس: قیمت دو رقمی برای ریپل (XRP) غیرواقعی است

تحلیلگر سرشناس: قیمت دو رقمی برای ریپل (XRP) غیرواقعی است

17 آذر 1404
پهپاد ۱۶ تنی  Jetank در چین به پرواز درآمد

پهپاد ۱۶ تنی  Jetank در چین به پرواز درآمد + ویدیو

22 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

اگر ارزش صندوق‌های ETF ریپل (XRP) به ۱۰ میلیارد دلار برسند چه اتفاقی می‌افتد؟

اگر ارزش صندوق‌های ETF ریپل (XRP) به ۱۰ میلیارد دلار برسند چه اتفاقی می‌افتد؟

23 آذر 1404
جمع‌بندی هفتگی اخبار دنیای رمزارزها | ۱۴ دسامبر ۲۰۲۵

جمع‌بندی هفتگی اخبار دنیای رمزارزها | ۱۴ دسامبر ۲۰۲۵

23 آذر 1404
معاون بانک مرکزی هند: بیت‌کوین فاقد ارزش واقعی است

معاون بانک مرکزی هند: بیت‌کوین فاقد ارزش واقعی است

23 آذر 1404
قرارداد جدید مایکروسافت برای حذف میلیون‌ها تن کربن

قرارداد جدید مایکروسافت برای حذف میلیون‌ها تن کربن

23 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir