• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

امیرحسین یونس نوشته شده توسط امیرحسین یونس
چهارشنبه 9 آبان 1403 - 18:25
در اخبار هوش مصنوعی
مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. تحلیل رفتار داخلی مدل‌های زبانی بزرگ
  • 2. نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی
  • 3. طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها
  • 4. صداقت مهارت‌محور و توانایی تعمیم مدل‌ها
  • 5. تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها
  • 6. پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

مطالعه جدید نشان می‌دهد که مدل‌های زبانی بزرگ (LLM) هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند تا قابلیت اطمینان در تولید متن بهبود یابد.

به‌گزارش تک‌ناک، پژوهش جدید محققان مؤسسه تکنیکون و گوگل ریسرچ و اپل نشان می‌دهد مدل‌های زبانی بزرگ (LLMs) از توانایی شناسایی خطاهای خود برخوردارند. این مطالعه حاکی از آن است که مدل‌های زبانی بیش از آنچه پیش‌تر تصور می‌شد، درک عمیق‌تری از صداقت پاسخ‌هایشان دارند.

مدل‌های زبانی بزرگ مانند ChatGPT و BERT به‌دلیل تمایل به تولید پاسخ‌های نادرست یا بی‌معنی که به آن‌ها «توهمات» گفته می‌شود، همواره با انتقاد روبه‌رو بوده‌اند. اصطلاح توهم فاقد تعریف واحدی است و طیف گسترده‌ای از خطاها را در‌بر می‌گیرد؛ از‌جمله نادرستی‌های واقعی، تعصبات، شکست‌های منطقی در استدلال و دیگر خطاهای دنیای واقعی. در این تحقیق، محققان این مفهوم را به‌عنوان تمامی خطاهای تولیدی مدل در نظر گرفتند.

01
از 06
تحلیل رفتار داخلی مدل‌های زبانی بزرگ

ونچربیت می‌نویسد که تا به امروز بیشتر تحقیقات در‌زمینه‌ توهمات مدل‌های زبانی بر رفتار خارجی آن‌ها و تحلیل برداشت کاربران از این خطاها متمرکز بود. این روش‌ها درک برخی جنبه‌های خطاهای مدل‌ها را ممکن می‌کرد؛ اما بینش محدودی درباره نحوه پردازش و رمزگذاری خطاها در داخل مدل‌ها ارائه می‌داد. در‌مقابل، پژوهش جدید با بررسی دقیق فعالیت‌های داخلی مدل‌ها نشان داد که مدل‌های زبانی بزرگ سیگنال‌های مرتبط با صداقت و درستی را در پاسخ‌های خود رمزگذاری می‌کنند.

برخلاف تلاش‌های پیشین که تنها بر تازه‌ترین توکن تولید‌شده یا توکن ورودی مدل‌ها متمرکز بودند، این تحقیق جدید به‌جای تمرکز صرف بر خروجی نهایی،توکن‌های خاص پاسخ را بررسی می‌کند که تغییر آن‌ها می‌تواند درستی پاسخ را تغییر دهد. محققان این شیوه را «توکن‌های پاسخ دقیق» نام‌گذاری کرده‌اند. این رویکرد به آن‌ها اجازه داد تا اطلاعات جامع‌تری از نحوه پردازش صداقت مدل‌ها در جریان تولید پاسخ‌ها به‌دست آورند.

تشخیص و اصلاح اشتباه مدل‌های زبانی بزرگ توسط خود

02
از 06
نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی

پژوهشگران آزمایش‌های خود را روی چهار نسخه از مدل‌های Mistral 7B و Llama 2 انجام دادند. این مدل‌ها روی ۱۰ مجموعه داده مختلف شامل وظایفی نظیر پاسخ به پرسش‌ها، استنتاج زبانی طبیعی، حل مسئله ریاضی و تحلیل احساسات آزمایش شدند. آن‌ها برای شبیه‌سازی استفاده واقعی به مدل‌ها اجازه دادند پاسخ‌هایی بدون محدودیت تولید کنند. یافته‌ها نشان داد که اطلاعات مربوط به صداقت پاسخ‌ها عمدتاً در توکن‌های پاسخ دقیق متمرکز شده است.

این الگوهای صداقت در تقریباً تمامی مجموعه داده‌ها و مدل‌ها ثابت ماند. محققان دراین‌باره می‌گویند:

این نتایج نشان‌دهنده مکانیسم عمومی در مدل‌های زبانی بزرگ است که طی آن مدل‌ها اطلاعات مرتبط با صداقت و درستی را در جریان تولید متن پردازش و رمزگذاری می‌کنند.

03
از 06
طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها

محققان در این مطالعه از طبقه‌بندهایی با عنوان «طبقه‌بندهای جست‌وجوگر» استفاده کردند. این طبقه‌بندها که به‌طور خاص برای تشخیص ویژگی‌های مرتبط با صداقت خروجی‌های تولید‌شده طراحی شده‌اند، با توجه به فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌توانند خطاها را پیش‌بینی کنند. آزمایش‌ها نشان داد که آموزش این طبقه‌بندی‌ها با استفاده از توکن‌های پاسخ دقیق می‌تواند دقت در تشخیص خطاها را بسیار افزایش دهد.

04
از 06
صداقت مهارت‌محور و توانایی تعمیم مدل‌ها

پژوهش یادشده نشان داد که مدل‌های زبانی بزرگ صداقت را به‌صورت «مهارت‌محور» رمزگذاری می‌کنند. این یعنی طبقه‌بندهای جست‌وجوگر، تنها در‌زمینه وظایفی با نیازهای مهارتی مشابه مانند بازیابی واقعیات یا استدلال منطقی، می‌توانند عملکرد خود را تعمیم دهند؛؛ اما در وظایف متفاوت نظیر تحلیل احساسات توانایی تعمیم ندارند. محققان این یافته را به‌عنوان ویژگی مهم مدل‌ها ارزیابی کردند و نشان دادند که مدل‌ها برای هر مجموعه از مهارت‌ها جداگانه سیگنال‌های مرتبط با صداقت را پردازش و ذخیره می‌کنند.

05
از 06
تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها

تحلیل‌های این پژوهش تفاوت شگفت‌آوری را بین فعالیت‌های داخلی مدل‌ها و پاسخ‌های نهایی آن‌ها نشان داد. در نمونه‌هایی مشاهده شد که مدل‌ها با وجود رمزگذاری پاسخ درست در فعالیت‌های داخلی خود، پاسخی نادرست تولید می‌کنند. این یافته حاکی از آن است که روش‌های ارزیابی فعلی که تنها بر خروجی نهایی مدل‌ها متکی هستند، ممکن است نتوانند به‌درستی قابلیت‌های واقعی آن‌ها را منعکس کنند.

به‌گفته محققان، این تفاوت نشان می‌دهد که با درک و استفاده بهتر از اطلاعات داخلی مدل‌ها، می‌توان به توانایی‌های پنهان آن‌ها دست یافت و نرخ خطاها را بسیار کاهش داد.

06
از 06
پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

این یافته‌ها می‌تواند به طراحی سیستم‌های جدیدی برای کاهش توهمات در مدل‌های زبانی کمک کند؛ هرچند این تکنیک‌ها عمدتاً در مدل‌های منبع‌باز کاربرد دارند که دسترسی به فعالیت‌های داخلی آن‌ها امکان‌پذیر است. ازیک‌سو، تحلیل فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌تواند به توسعه تکنیک‌های مؤثرتری برای شناسایی و کاهش خطا کمک کند و از‌سوی‌دیگر، به‌عنوان بخشی از تحقیقات وسیع‌تر درک بهتری از فرایندهای داخلی مدل‌های زبانی بزرگ ارائه دهد.

آزمایشگاه‌های پیشرو هوش مصنوعی نظیر OpenAI و آنتروپیک و دیپ‌مایند گوگل نیز با روش‌های متفاوت عملکرد داخلی مدل‌ها را مطالعه کرده‌اند. این مطالعات در‌مجموع می‌تواند به ساخت مدل‌های زبانی با قابلیت‌های پیشرفته‌تر و سیستم‌های هوشمندتر و مطمئن‌تر کمک کند. محققان در‌این‌باره نوشتند:

«یافته‌های ما نشان می‌دهد که نمایش‌های داخلی مدل‌های زبانی بزرگ بینش‌های مفیدی در‌زمینه خطاهای آن‌ها فراهم و پیچیدگی پیوند بین فرایندهای داخلی مدل‌ها و خروجی‌های خارجی را برجسته می‌کند. امیدواریم راهی برای بهبود بیشتر در تشخیص و کاهش خطاها وجود داشته باشد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

قابلیت Manus Agents؛ ورود رسمی متا به بازار عامل‌های شخصی هوش مصنوعی
اخبار هوش مصنوعی

قابلیت Manus Agents؛ ورود رسمی متا به بازار عامل‌های شخصی هوش مصنوعی

نوشته شده توسط نرگس چالوک
28 بهمن 1404
پارلمان اروپا استفاده از هوش مصنوعی را در دستگاه‌های دولتی ممنوع کرد
اخبار هوش مصنوعی

پارلمان اروپا استفاده از هوش مصنوعی را در دستگاه‌های دولتی ممنوع کرد

نوشته شده توسط سید محمد برازنده
28 بهمن 1404
کپی‌رایت بایت‌دنس
اخبار هوش مصنوعی

کلیپ مبارزه برد پیت و تام کروز دردسرساز شد؛ بایت‌دنس در پی تشدید محدودیت‌های تولید ویدئو با هوش مصنوعی

نوشته شده توسط مانی
27 بهمن 1404
تصویر یک رویداد مرتبط با صنعت فضایی و فناوری که در آن ایلان ماسک با پوشش نیمه‌رسمی در فضای داخلی مدرن ایستاده است. در پس‌زمینه، لوگوی بزرگ SpaceX و سازه‌ای صنعتی با نورپردازی قرمز و آبی دیده می‌شود که تداعی‌گر محیط مهندسی، پرتاب فضایی و نوآوری در فناوری هوافضا است.
اخبار هوش مصنوعی

هوش مصنوعی برق آمریکا را می‌بلعد؛ ماسک ایده انتقال دیتاسنترها به فضا را مطرح کرد

نوشته شده توسط تارخ ترهنده
27 بهمن 1404
نمای یک سخنرانی رسمی در رویداد World Economic Forum با پس‌زمینه آبی و لوگوی تکرارشونده این رویداد جهانی. یک سخنران با پوشش رسمی در پشت تریبون و میکروفن قرار دارد و فضای تصویر، حال‌وهوای کنفرانس اقتصادی بین‌المللی، سیاست‌گذاری و فناوری را منتقل می‌کند.
اخبار هوش مصنوعی

حمله بی‌سابقه ماسک به فیلسوف آنتروپیک: «سهم تو از آینده کجاست؟»

نوشته شده توسط تارخ ترهنده
27 بهمن 1404
خبر بعدی
جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

قیمت بیت‌کوین (BTC)

آیا ریزش قیمت بیت‌کوین به پایان رسیده است؟

27 بهمن 1404
تصویر گرافیکی از آیکن مفهومی iOS 26.3 با طراحی شفاف و لایه‌ای، شامل ترکیب رنگ‌های آبی، سبز و سفید روی پس‌زمینه گرادیانی نرم؛ عدد 26.3 در مرکز آیکن دیده می‌شود و تصویر حس به‌روزرسانی نرم‌افزاری، طراحی مینیمال و تمرکز اپل بر رابط کاربری مدرن را القا می‌کند.

اپل به روزرسانی iOS 26.3 و سیستم عامل iPadOS 26.3 را منتشر کرد

22 بهمن 1404 - به‌روزشده در 23 بهمن 1404

داغ‌ترین‌های روز

سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید

سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید + جدول مشخصات

25 بهمن 1404

ایران کجای نقشه جهانی هوش مصنوعی ایستاده است؟

25 بهمن 1404
وقفه عملیاتی شیائومی

شیائومی ترمز به‌روزرسانی‌ها را کشید؛ آپدیت HyperOS تا ۳ مارس متوقف شد

24 بهمن 1404 - به‌روزشده در 25 بهمن 1404
پوستر تبلیغاتی One UI 8.5 روی پس‌زمینه بنفش با تصویر یک گوشی هوشمند.

لیست سیاه سامسونگ لو رفت؛ محرومیت میلیون‌ها کاربر از به‌روزرسانی One UI 8.5

20 بهمن 1404 - به‌روزشده در 21 بهمن 1404
بهترین گوشی های کارکرده

این گوشی‌های کارکرده هنوز ارزش خرید دارند!

26 بهمن 1404 - به‌روزشده در 27 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

چهار مسیر آسان ثبت نام اینترنت فیبرنوری مخابرات + اینفوگرافیک

چهار مسیر آسان ثبت نام اینترنت فیبرنوری مخابرات + اینفوگرافیک

28 بهمن 1404
آیا قیمت بیت‌کوین پس از حفظ حمایت ۶۵,۰۰۰ دلار می‌تواند از سطح ۷۲,۶۰۰ دلار عبور کند؟

آیا قیمت بیت‌کوین پس از حفظ حمایت ۶۵ هزار دلار می‌تواند از سطح ۷۲,۶۰۰ دلار عبور کند؟ + تصویر

28 بهمن 1404
کاهش شدید هدف قیمتی ریپل از ۸ دلار به ۲.۸۰ دلار توسط استاندارد چارترد

کاهش شدید هدف قیمتی ریپل از ۸ دلار به ۲.۸۰ دلار توسط استاندارد چارترد

28 بهمن 1404
چرا قیمت بیت‌کوین، اتریوم و ریپل امروز کاهش یافته است؟

چرا قیمت بیت‌کوین، اتریوم و ریپل امروز کاهش یافت؟

28 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir