• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

امیرحسین یونس نوشته شده توسط امیرحسین یونس
چهارشنبه 9 آبان 1403 - 18:25
در اخبار هوش مصنوعی
مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. تحلیل رفتار داخلی مدل‌های زبانی بزرگ
  • 2. نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی
  • 3. طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها
  • 4. صداقت مهارت‌محور و توانایی تعمیم مدل‌ها
  • 5. تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها
  • 6. پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

مطالعه جدید نشان می‌دهد که مدل‌های زبانی بزرگ (LLM) هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند تا قابلیت اطمینان در تولید متن بهبود یابد.

به‌گزارش تک‌ناک، پژوهش جدید محققان مؤسسه تکنیکون و گوگل ریسرچ و اپل نشان می‌دهد مدل‌های زبانی بزرگ (LLMs) از توانایی شناسایی خطاهای خود برخوردارند. این مطالعه حاکی از آن است که مدل‌های زبانی بیش از آنچه پیش‌تر تصور می‌شد، درک عمیق‌تری از صداقت پاسخ‌هایشان دارند.

مدل‌های زبانی بزرگ مانند ChatGPT و BERT به‌دلیل تمایل به تولید پاسخ‌های نادرست یا بی‌معنی که به آن‌ها «توهمات» گفته می‌شود، همواره با انتقاد روبه‌رو بوده‌اند. اصطلاح توهم فاقد تعریف واحدی است و طیف گسترده‌ای از خطاها را در‌بر می‌گیرد؛ از‌جمله نادرستی‌های واقعی، تعصبات، شکست‌های منطقی در استدلال و دیگر خطاهای دنیای واقعی. در این تحقیق، محققان این مفهوم را به‌عنوان تمامی خطاهای تولیدی مدل در نظر گرفتند.

01
از 06
تحلیل رفتار داخلی مدل‌های زبانی بزرگ

ونچربیت می‌نویسد که تا به امروز بیشتر تحقیقات در‌زمینه‌ توهمات مدل‌های زبانی بر رفتار خارجی آن‌ها و تحلیل برداشت کاربران از این خطاها متمرکز بود. این روش‌ها درک برخی جنبه‌های خطاهای مدل‌ها را ممکن می‌کرد؛ اما بینش محدودی درباره نحوه پردازش و رمزگذاری خطاها در داخل مدل‌ها ارائه می‌داد. در‌مقابل، پژوهش جدید با بررسی دقیق فعالیت‌های داخلی مدل‌ها نشان داد که مدل‌های زبانی بزرگ سیگنال‌های مرتبط با صداقت و درستی را در پاسخ‌های خود رمزگذاری می‌کنند.

برخلاف تلاش‌های پیشین که تنها بر تازه‌ترین توکن تولید‌شده یا توکن ورودی مدل‌ها متمرکز بودند، این تحقیق جدید به‌جای تمرکز صرف بر خروجی نهایی،توکن‌های خاص پاسخ را بررسی می‌کند که تغییر آن‌ها می‌تواند درستی پاسخ را تغییر دهد. محققان این شیوه را «توکن‌های پاسخ دقیق» نام‌گذاری کرده‌اند. این رویکرد به آن‌ها اجازه داد تا اطلاعات جامع‌تری از نحوه پردازش صداقت مدل‌ها در جریان تولید پاسخ‌ها به‌دست آورند.

تشخیص و اصلاح اشتباه مدل‌های زبانی بزرگ توسط خود

02
از 06
نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی

پژوهشگران آزمایش‌های خود را روی چهار نسخه از مدل‌های Mistral 7B و Llama 2 انجام دادند. این مدل‌ها روی ۱۰ مجموعه داده مختلف شامل وظایفی نظیر پاسخ به پرسش‌ها، استنتاج زبانی طبیعی، حل مسئله ریاضی و تحلیل احساسات آزمایش شدند. آن‌ها برای شبیه‌سازی استفاده واقعی به مدل‌ها اجازه دادند پاسخ‌هایی بدون محدودیت تولید کنند. یافته‌ها نشان داد که اطلاعات مربوط به صداقت پاسخ‌ها عمدتاً در توکن‌های پاسخ دقیق متمرکز شده است.

این الگوهای صداقت در تقریباً تمامی مجموعه داده‌ها و مدل‌ها ثابت ماند. محققان دراین‌باره می‌گویند:

این نتایج نشان‌دهنده مکانیسم عمومی در مدل‌های زبانی بزرگ است که طی آن مدل‌ها اطلاعات مرتبط با صداقت و درستی را در جریان تولید متن پردازش و رمزگذاری می‌کنند.

03
از 06
طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها

محققان در این مطالعه از طبقه‌بندهایی با عنوان «طبقه‌بندهای جست‌وجوگر» استفاده کردند. این طبقه‌بندها که به‌طور خاص برای تشخیص ویژگی‌های مرتبط با صداقت خروجی‌های تولید‌شده طراحی شده‌اند، با توجه به فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌توانند خطاها را پیش‌بینی کنند. آزمایش‌ها نشان داد که آموزش این طبقه‌بندی‌ها با استفاده از توکن‌های پاسخ دقیق می‌تواند دقت در تشخیص خطاها را بسیار افزایش دهد.

04
از 06
صداقت مهارت‌محور و توانایی تعمیم مدل‌ها

پژوهش یادشده نشان داد که مدل‌های زبانی بزرگ صداقت را به‌صورت «مهارت‌محور» رمزگذاری می‌کنند. این یعنی طبقه‌بندهای جست‌وجوگر، تنها در‌زمینه وظایفی با نیازهای مهارتی مشابه مانند بازیابی واقعیات یا استدلال منطقی، می‌توانند عملکرد خود را تعمیم دهند؛؛ اما در وظایف متفاوت نظیر تحلیل احساسات توانایی تعمیم ندارند. محققان این یافته را به‌عنوان ویژگی مهم مدل‌ها ارزیابی کردند و نشان دادند که مدل‌ها برای هر مجموعه از مهارت‌ها جداگانه سیگنال‌های مرتبط با صداقت را پردازش و ذخیره می‌کنند.

05
از 06
تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها

تحلیل‌های این پژوهش تفاوت شگفت‌آوری را بین فعالیت‌های داخلی مدل‌ها و پاسخ‌های نهایی آن‌ها نشان داد. در نمونه‌هایی مشاهده شد که مدل‌ها با وجود رمزگذاری پاسخ درست در فعالیت‌های داخلی خود، پاسخی نادرست تولید می‌کنند. این یافته حاکی از آن است که روش‌های ارزیابی فعلی که تنها بر خروجی نهایی مدل‌ها متکی هستند، ممکن است نتوانند به‌درستی قابلیت‌های واقعی آن‌ها را منعکس کنند.

به‌گفته محققان، این تفاوت نشان می‌دهد که با درک و استفاده بهتر از اطلاعات داخلی مدل‌ها، می‌توان به توانایی‌های پنهان آن‌ها دست یافت و نرخ خطاها را بسیار کاهش داد.

06
از 06
پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

این یافته‌ها می‌تواند به طراحی سیستم‌های جدیدی برای کاهش توهمات در مدل‌های زبانی کمک کند؛ هرچند این تکنیک‌ها عمدتاً در مدل‌های منبع‌باز کاربرد دارند که دسترسی به فعالیت‌های داخلی آن‌ها امکان‌پذیر است. ازیک‌سو، تحلیل فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌تواند به توسعه تکنیک‌های مؤثرتری برای شناسایی و کاهش خطا کمک کند و از‌سوی‌دیگر، به‌عنوان بخشی از تحقیقات وسیع‌تر درک بهتری از فرایندهای داخلی مدل‌های زبانی بزرگ ارائه دهد.

آزمایشگاه‌های پیشرو هوش مصنوعی نظیر OpenAI و آنتروپیک و دیپ‌مایند گوگل نیز با روش‌های متفاوت عملکرد داخلی مدل‌ها را مطالعه کرده‌اند. این مطالعات در‌مجموع می‌تواند به ساخت مدل‌های زبانی با قابلیت‌های پیشرفته‌تر و سیستم‌های هوشمندتر و مطمئن‌تر کمک کند. محققان در‌این‌باره نوشتند:

«یافته‌های ما نشان می‌دهد که نمایش‌های داخلی مدل‌های زبانی بزرگ بینش‌های مفیدی در‌زمینه خطاهای آن‌ها فراهم و پیچیدگی پیوند بین فرایندهای داخلی مدل‌ها و خروجی‌های خارجی را برجسته می‌کند. امیدواریم راهی برای بهبود بیشتر در تشخیص و کاهش خطاها وجود داشته باشد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

پس‌زمینه انتزاعی با گرادیانت محو و رنگارنگ (صورتی، نارنجی، آبی روشن) با متن سفید "GPT-5.1" در سمت چپ و "OpenAI" در سمت راست.
اخبار هوش مصنوعی

شرکت OepnAI ازمدل هوش مصنوعی GPT-5.1  رونمایی کرد

نوشته شده توسط اسما کلهر
22 آبان 1404
لوگوی Anthropic (حروف سیاه AI که حرف A فاقد خط افقی است) بر روی پس‌زمینه‌ای گرافیکی با رنگ‌های صورتی روشن و قهوه‌ای خاکی.
اخبار هوش مصنوعی

آنتروپیک ۵۰ میلیارد دلار برای ساخت مراکز داده هوش مصنوعی در آمریکا سرمایه‌گذاری می‌کند

نوشته شده توسط اسما کلهر
21 آبان 1404
رابط کاربری با متن ورودی "Book a flight" که تکمیل خودکار هوش مصنوعی مقاصد اخیر مانند "New York" و "Chicago" را از تقویم پیشنهاد می‌کند.
اخبار هوش مصنوعی

Hero SDK پرامپت‌های هوش مصنوعی را خودش می‌نویسد

نوشته شده توسط اسما کلهر
21 آبان 1404
دو شخصیت بازی ویدئویی در زره و لباس‌های نظامی (یکی با فیلتر نارنجی/قرمز و دیگری در جلو با لباس سفید و قرمز) در مقابل یک پس‌زمینه تاریک با نوارهای رنگی روشن در سمت چپ.
اخبار هوش مصنوعی

ادعای جنجالی مدیرعامل نکسون: همه شرکت‌های بازیسازی از هوش مصنوعی استفاده می‌کنند

نوشته شده توسط اسما کلهر
21 آبان 1404
نمای نزدیک از آیکون اپلیکیشن Wallet اپل روی صفحه نمایش یک گوشی با پس‌زمینه آبی روشن.
اخبار هوش مصنوعی

اپل از Digital ID رونمایی کرد؛ پاسپورت دیجیتال روی تلفن همراه

نوشته شده توسط اسما کلهر
21 آبان 1404
خبر بعدی
جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

شیائومی ۱۷ ایر احتمالا تولید می‌شود؛ شرکت چینی از شکست گوشی‌های فوق‌باریک درس نگرفت

شیائومی ۱۷ ایر احتمالا تولید می‌شود

2 آبان 1404 - به‌روزشده در 3 آبان 1404
گلکسی S26 سامسونگ با دوربین‌های بزرگ‌تر و باتری‌های قوی‌تر عرضه می‌ شود

گلکسی S26 سامسونگ با دوربین‌های بزرگ‌تر و باتری‌های قوی‌تر عرضه می‌ شود

10 آبان 1404 - به‌روزشده در 11 آبان 1404

داغ‌ترین‌های روز

پیش‌بینی قیمت ریپل (XRP) پس از راه‌اندازی صندوق ETF شرکت کنری کپیتال

پیش‌بینی قیمت ریپل (XRP) پس از راه‌اندازی صندوق ETF شرکت کنری کپیتال

21 آبان 1404
بهترین هندزفری سیمی ۲۰۲۵؛ انتخابی مطمئن برای موسیقی، مکالمه و گیمینگ

بهترین هندزفری سیمی ۲۰۲۵؛ انتخابی مطمئن برای موسیقی، مکالمه و گیمینگ

18 آبان 1404
پژو ۹۰۷ با موتور V12؛ گرندتورری که می‌ توانست رقیب فراری و استون شود

پژو ۹۰۷ با موتور V12؛ گرندتورری که می‌ توانست رقیب فراری و استون شود + تصویر

15 آبان 1404 - به‌روزشده در 17 آبان 1404
مایکروسافت نسخه ویژه ویندوز ۱۱ را با نام 26H1 معرفی کرد

مایکروسافت نسخه ویژه ویندوز ۱۱ را با نام 26H1 معرفی کرد

17 آبان 1404 - به‌روزشده در 18 آبان 1404
شیائومی آزمایش HyperOS 3 مبتنی بر اندروید 15 را روی ۱۲ گوشی آغاز کرد

شیائومی آزمایش HyperOS 3 مبتنی بر اندروید ۱۵ را روی ۱۲ گوشی آغاز کرد

17 آبان 1404 - به‌روزشده در 18 آبان 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

پس‌زمینه انتزاعی با گرادیانت محو و رنگارنگ (صورتی، نارنجی، آبی روشن) با متن سفید "GPT-5.1" در سمت چپ و "OpenAI" در سمت راست.

شرکت OepnAI ازمدل هوش مصنوعی GPT-5.1  رونمایی کرد

22 آبان 1404
لوگوی Anthropic (حروف سیاه AI که حرف A فاقد خط افقی است) بر روی پس‌زمینه‌ای گرافیکی با رنگ‌های صورتی روشن و قهوه‌ای خاکی.

آنتروپیک ۵۰ میلیارد دلار برای ساخت مراکز داده هوش مصنوعی در آمریکا سرمایه‌گذاری می‌کند

21 آبان 1404
رابط کاربری با متن ورودی "Book a flight" که تکمیل خودکار هوش مصنوعی مقاصد اخیر مانند "New York" و "Chicago" را از تقویم پیشنهاد می‌کند.

Hero SDK پرامپت‌های هوش مصنوعی را خودش می‌نویسد

21 آبان 1404
یک مرد جوان در حال استفاده از عینک هوشمند (Smart Glasses) که داده‌های دیجیتالی (ساعت و اطلاعات فهرست) به رنگ نئون سبز را در جلوی چشم او نمایش می‌دهد، و در دستش یک حلقه کنترلر (R1) دارد.

G2 معرفی شد؛ عینکی که با یک حلقه کنترل می‌شود

21 آبان 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir