• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند

امیرحسین یونس نوشته شده توسط امیرحسین یونس
چهارشنبه 9 آبان 1403 - 18:25
در اخبار هوش مصنوعی
مدل‌های زبانی بزرگ هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. تحلیل رفتار داخلی مدل‌های زبانی بزرگ
  • 2. نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی
  • 3. طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها
  • 4. صداقت مهارت‌محور و توانایی تعمیم مدل‌ها
  • 5. تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها
  • 6. پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

مطالعه جدید نشان می‌دهد که مدل‌های زبانی بزرگ (LLM) هوش مصنوعی می‌توانند اشتباهات خود را تشخیص دهند تا قابلیت اطمینان در تولید متن بهبود یابد.

به‌گزارش تک‌ناک، پژوهش جدید محققان مؤسسه تکنیکون و گوگل ریسرچ و اپل نشان می‌دهد مدل‌های زبانی بزرگ (LLMs) از توانایی شناسایی خطاهای خود برخوردارند. این مطالعه حاکی از آن است که مدل‌های زبانی بیش از آنچه پیش‌تر تصور می‌شد، درک عمیق‌تری از صداقت پاسخ‌هایشان دارند.

مدل‌های زبانی بزرگ مانند ChatGPT و BERT به‌دلیل تمایل به تولید پاسخ‌های نادرست یا بی‌معنی که به آن‌ها «توهمات» گفته می‌شود، همواره با انتقاد روبه‌رو بوده‌اند. اصطلاح توهم فاقد تعریف واحدی است و طیف گسترده‌ای از خطاها را در‌بر می‌گیرد؛ از‌جمله نادرستی‌های واقعی، تعصبات، شکست‌های منطقی در استدلال و دیگر خطاهای دنیای واقعی. در این تحقیق، محققان این مفهوم را به‌عنوان تمامی خطاهای تولیدی مدل در نظر گرفتند.

01
از 06
تحلیل رفتار داخلی مدل‌های زبانی بزرگ

ونچربیت می‌نویسد که تا به امروز بیشتر تحقیقات در‌زمینه‌ توهمات مدل‌های زبانی بر رفتار خارجی آن‌ها و تحلیل برداشت کاربران از این خطاها متمرکز بود. این روش‌ها درک برخی جنبه‌های خطاهای مدل‌ها را ممکن می‌کرد؛ اما بینش محدودی درباره نحوه پردازش و رمزگذاری خطاها در داخل مدل‌ها ارائه می‌داد. در‌مقابل، پژوهش جدید با بررسی دقیق فعالیت‌های داخلی مدل‌ها نشان داد که مدل‌های زبانی بزرگ سیگنال‌های مرتبط با صداقت و درستی را در پاسخ‌های خود رمزگذاری می‌کنند.

برخلاف تلاش‌های پیشین که تنها بر تازه‌ترین توکن تولید‌شده یا توکن ورودی مدل‌ها متمرکز بودند، این تحقیق جدید به‌جای تمرکز صرف بر خروجی نهایی،توکن‌های خاص پاسخ را بررسی می‌کند که تغییر آن‌ها می‌تواند درستی پاسخ را تغییر دهد. محققان این شیوه را «توکن‌های پاسخ دقیق» نام‌گذاری کرده‌اند. این رویکرد به آن‌ها اجازه داد تا اطلاعات جامع‌تری از نحوه پردازش صداقت مدل‌ها در جریان تولید پاسخ‌ها به‌دست آورند.

تشخیص و اصلاح اشتباه مدل‌های زبانی بزرگ توسط خود

02
از 06
نتایج آزمایش و تمرکز اطلاعات صداقت در توکن‌های کلیدی

پژوهشگران آزمایش‌های خود را روی چهار نسخه از مدل‌های Mistral 7B و Llama 2 انجام دادند. این مدل‌ها روی ۱۰ مجموعه داده مختلف شامل وظایفی نظیر پاسخ به پرسش‌ها، استنتاج زبانی طبیعی، حل مسئله ریاضی و تحلیل احساسات آزمایش شدند. آن‌ها برای شبیه‌سازی استفاده واقعی به مدل‌ها اجازه دادند پاسخ‌هایی بدون محدودیت تولید کنند. یافته‌ها نشان داد که اطلاعات مربوط به صداقت پاسخ‌ها عمدتاً در توکن‌های پاسخ دقیق متمرکز شده است.

این الگوهای صداقت در تقریباً تمامی مجموعه داده‌ها و مدل‌ها ثابت ماند. محققان دراین‌باره می‌گویند:

این نتایج نشان‌دهنده مکانیسم عمومی در مدل‌های زبانی بزرگ است که طی آن مدل‌ها اطلاعات مرتبط با صداقت و درستی را در جریان تولید متن پردازش و رمزگذاری می‌کنند.

03
از 06
طبقه‌بندهای جست‌وجوگر برای شناسایی خطاها

محققان در این مطالعه از طبقه‌بندهایی با عنوان «طبقه‌بندهای جست‌وجوگر» استفاده کردند. این طبقه‌بندها که به‌طور خاص برای تشخیص ویژگی‌های مرتبط با صداقت خروجی‌های تولید‌شده طراحی شده‌اند، با توجه به فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌توانند خطاها را پیش‌بینی کنند. آزمایش‌ها نشان داد که آموزش این طبقه‌بندی‌ها با استفاده از توکن‌های پاسخ دقیق می‌تواند دقت در تشخیص خطاها را بسیار افزایش دهد.

04
از 06
صداقت مهارت‌محور و توانایی تعمیم مدل‌ها

پژوهش یادشده نشان داد که مدل‌های زبانی بزرگ صداقت را به‌صورت «مهارت‌محور» رمزگذاری می‌کنند. این یعنی طبقه‌بندهای جست‌وجوگر، تنها در‌زمینه وظایفی با نیازهای مهارتی مشابه مانند بازیابی واقعیات یا استدلال منطقی، می‌توانند عملکرد خود را تعمیم دهند؛؛ اما در وظایف متفاوت نظیر تحلیل احساسات توانایی تعمیم ندارند. محققان این یافته را به‌عنوان ویژگی مهم مدل‌ها ارزیابی کردند و نشان دادند که مدل‌ها برای هر مجموعه از مهارت‌ها جداگانه سیگنال‌های مرتبط با صداقت را پردازش و ذخیره می‌کنند.

05
از 06
تناقض بین فعالیت‌های داخلی و پاسخ‌های نهایی مدل‌ها

تحلیل‌های این پژوهش تفاوت شگفت‌آوری را بین فعالیت‌های داخلی مدل‌ها و پاسخ‌های نهایی آن‌ها نشان داد. در نمونه‌هایی مشاهده شد که مدل‌ها با وجود رمزگذاری پاسخ درست در فعالیت‌های داخلی خود، پاسخی نادرست تولید می‌کنند. این یافته حاکی از آن است که روش‌های ارزیابی فعلی که تنها بر خروجی نهایی مدل‌ها متکی هستند، ممکن است نتوانند به‌درستی قابلیت‌های واقعی آن‌ها را منعکس کنند.

به‌گفته محققان، این تفاوت نشان می‌دهد که با درک و استفاده بهتر از اطلاعات داخلی مدل‌ها، می‌توان به توانایی‌های پنهان آن‌ها دست یافت و نرخ خطاها را بسیار کاهش داد.

06
از 06
پیامدهای آینده و گام‌های بعدی در تحقیقات مدل‌های زبانی بزرگ

این یافته‌ها می‌تواند به طراحی سیستم‌های جدیدی برای کاهش توهمات در مدل‌های زبانی کمک کند؛ هرچند این تکنیک‌ها عمدتاً در مدل‌های منبع‌باز کاربرد دارند که دسترسی به فعالیت‌های داخلی آن‌ها امکان‌پذیر است. ازیک‌سو، تحلیل فعالیت‌های داخلی مدل‌های زبانی بزرگ می‌تواند به توسعه تکنیک‌های مؤثرتری برای شناسایی و کاهش خطا کمک کند و از‌سوی‌دیگر، به‌عنوان بخشی از تحقیقات وسیع‌تر درک بهتری از فرایندهای داخلی مدل‌های زبانی بزرگ ارائه دهد.

آزمایشگاه‌های پیشرو هوش مصنوعی نظیر OpenAI و آنتروپیک و دیپ‌مایند گوگل نیز با روش‌های متفاوت عملکرد داخلی مدل‌ها را مطالعه کرده‌اند. این مطالعات در‌مجموع می‌تواند به ساخت مدل‌های زبانی با قابلیت‌های پیشرفته‌تر و سیستم‌های هوشمندتر و مطمئن‌تر کمک کند. محققان در‌این‌باره نوشتند:

«یافته‌های ما نشان می‌دهد که نمایش‌های داخلی مدل‌های زبانی بزرگ بینش‌های مفیدی در‌زمینه خطاهای آن‌ها فراهم و پیچیدگی پیوند بین فرایندهای داخلی مدل‌ها و خروجی‌های خارجی را برجسته می‌کند. امیدواریم راهی برای بهبود بیشتر در تشخیص و کاهش خطاها وجود داشته باشد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

گوگل با معرفی سرورهای مدیریت‌شده MCP، اتصال ایجنت‌های هوش مصنوعی به سرویس‌های دنیای واقعی را متحول کرد.
اخبار هوش مصنوعی

گوگل مسیر اتصال هوش مصنوعی به دنیای واقعی را هموار کرد

نوشته شده توسط اسما کلهر
19 آذر 1404
رابط ویرایشی ChatGPT در حال افزایش میزان Vibrance یک عکس از دو نفر در فضای بیرونی، همراه با نمایش مقایسه قبل و بعد و ابزار ادغام با Adobe Photoshop
اخبار هوش مصنوعی

تجربه سریع و هوشمند ویرایش فایل‌ها با ادغام ادوبی با ChatGPT فراهم شد

نوشته شده توسط تارخ ترهنده
19 آذر 1404
نوار ابزار ویرایش تصویر مبتنی بر هوش مصنوعی با گزینه‌هایی مثل انتخاب ناحیه، حذف و ایزوله‌سازی، درحال ویرایش عکس یک فنجان قهوه و برش کیک در پس‌زمینه نارنجی
اخبار هوش مصنوعی

فیگما ابزار هوش مصنوعی حذف پس‌زمینه و اشیاء از تصاویر را معرفی کرد

نوشته شده توسط تارخ ترهنده
19 آذر 1404
کامپیوتر قدیمی رومیزی با مانیتور CRT و صفحه‌نمایشی شامل شکل‌های هندسی شبیه صورت کارتونی روی پس‌زمینه آبی یکدست
اخبار هوش مصنوعی

استاندارد RSL 1.0 رسماً منتشر شد؛ کنترل محتوای وب در دستان ناشران

نوشته شده توسط تارخ ترهنده
19 آذر 1404
طرحی انتزاعی از انفجار پودر یا ذرات ریز به رنگ‌های بنفش و سفید.
اخبار هوش مصنوعی

جمنای و گراک؛ نمادهای جدید رشد و رقابت ابزارهای هوش مصنوعی

نوشته شده توسط امیرحسین یونس
19 آذر 1404
خبر بعدی
جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

جریمه ۲/۵ تریلیون تریلیون دلاری روسیه برای گوگل

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

چراغ سقفی هوشمند و حلقه‌ای شیائومی در فضای اتاق خواب با نوردهی یکنواخت.

گرانترین چراغ سقفی هوشمند شیائومی با فناوری محافظت از چشم عرضه شد

18 آذر 1404
ابرخودروی Magma GT با موتور V8 رونمایی شد

ابرخودروی Magma GT با موتور V8 رونمایی شد + ویدیو

6 آذر 1404

داغ‌ترین‌های روز

تحلیلگر سرشناس: قیمت دو رقمی برای ریپل (XRP) غیرواقعی است

تحلیلگر سرشناس: قیمت دو رقمی برای ریپل (XRP) غیرواقعی است

17 آذر 1404
مایکروسافت ویندوز 11 را با یک به‌روزرسانی بزرگ متحول می‌ کند

مایکروسافت ویندوز ۱۱ را با یک به‌روزرسانی بزرگ متحول می‌ کند + تصویر

16 آذر 1404
بررسی ردمی نوت 15 پرو پلاس

بررسی ردمی نوت ۱۵ پرو پلاس؛ میان‌رده پرچم‌دار جدید شیائومی

16 آذر 1404
روش جدید ورود امن به تلگرام.

تلگرام احراز هویت بدون پیامک را فعال کرد

19 آذر 1404
نمای نزدیک (ماکرو) از پین‌های طلایی اتصال در زیر یک پردازنده کامپیوتری (CPU).

مایکروسافت لیست پردازنده‌هایی که از ویندوز ۱۱ پشتیبانی می‌کند منتشر کرد

12 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

تصویر گرافیکی از رابط کاربری موبایل گوگل که بخش «داستان‌های برتر» (Top Stories) و ویژگی‌های آزمایشی هوش مصنوعی را نشان می‌دهد.

گوگل با ارتقای AI Mode نمایش لینک‌ها را در جست‌وجو افزایش می‌دهد

20 آذر 1404
تصویر هنری و تبلیغاتی برای معرفی اولین مانیتور RGB Mini-LED شرکت HKC با نمایش طیف رنگی گسترده.

شرکت HKC نخستین مانیتور RGB Mini LED جهان را معرفی می‌کند

20 آذر 1404
تصویری از نزدیک که یک تراشه هوش مصنوعی Ascend (متعلق به هواوی) را در قاب شیشه‌ای در دست یک فرد نشان می‌دهد.

چرخش ناگهانی کاخ سفید در صادرات H200 به چین

19 آذر 1404
شرکت OpenAI مدیرعامل Slack را به عنوان مدیر ارشد درآمد خود استخدام کرد

مدیرعامل اسلک سکاندار درآمدزایی غول هوش مصنوعی شد

19 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir