• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » دسته‌بندی نشده » چرا چت‌بات‌ها گیج می‌شوند؟؛ راز افت عملکرد هوش مصنوعی در مکالمات طولانی

چرا چت‌بات‌ها گیج می‌شوند؟؛ راز افت عملکرد هوش مصنوعی در مکالمات طولانی

تارخ ترهنده نوشته شده توسط تارخ ترهنده
جمعه 1 اسفند 1404 - 22:00
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
نمای گوشی هوشمند با آیکون اپلیکیشن‌های هوش مصنوعی از جمله ChatGPT، DeepSeek، Copilot، Gemini و Claude
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

نتایج پژوهش مشترک مایکروسافت و سیلزفورس نشان می‌دهد که افت عملکرد هوش مصنوعی در مکالمات طولانی باعث شده تا دقت مدل‌ها به ۶۵ درصد کاهش یابد.

به گزارش سرویس هوش مصنوعی تک‌ناک، برترین آزمایشگاه‌های پژوهشی هوش مصنوعی در سال‌های اخیر مدل‌های پیشرفته و چت‌بات‌های متعددی را منتشر کرده‌اند تا جایگاه برند خود را در این فضای به‌سرعت درحال تغییر تثبیت کنند با‌این‌حال، کاربران اغلب از این ابزارها شکایت و به پدیده توهم یا ارائه پاسخ‌های کاملا نادرست به پرسش‌ها اشاره می‌کنند.

براساس مقاله‌ای پژوهشی از Microsoft Research و Salesforce که بیش از ۲۰۰ هزار مکالمه از پیشرفته‌ترین مدل‌های زبانی بزرگ هوش مصنوعی ازجمله GPT‑4.1 و Gemini 2.5 Pro و Claude 3.7 Sonnet و o3 و DeepSeek R1 و Llama 4 را تحلیل کرده، مشخص شده است که این ابزارها وقتی وظایف در قالب گفت‌وگوی طبیعی و چندمرحله‌ای مطرح می‌شوند، اغلب در جریان مکالمه گم می‌شوند.

برای درک بهتر موضوع، مدل‌هایی مانند GPT‑4.1 و Gemini 2.5 Pro در مواجهه با پرسشی واحد به نرخ موفقیت حدود ۹۰ درصد دست پیدا می‌کنند. بااین‌حال، همین مدل‌ها در گفت‌وگوهای طولانی‌تر و رفت‌وبرگشتی، افت عملکرد درخورتوجهی را تجربه می‌کنند و میزان موفقیت آن‌ها به حدود ۶۵ درصد کاهش می‌یابد.

هوش مصنوعی مولد در صنعت فناوری عملاً به واژه متداولی تبدیل شده است و تقریباً همه درباره آن صحبت می‌کنند. این فناوری با وجود ادعاهایی مبنی‌بر اینکه حبابی در آستانه ترکیدن است، همچنان در سراسر جهان به‌طور گسترده درحال پذیرش است.

نمای رابط کاربری چت DeepSeek با پیام خوش‌آمدگویی روی صفحه نمایش

در سال ۲۰۲۴، مایکروسافت اعلام کرده بود که ChatGPT برتری خاصی بر کوپایلت ندارد. این شرکت در آن زمان اشاره کرده بود که کاربران از این محصول مطابق انتظار استفاده نمی‌کنند و در عین حال، ضعف در مهارت‌های پرامپت‌نویسی را عامل اصلی این موضوع دانسته بود.

پژوهش جدید نیز در ادامه همین دیدگاه نشان می‌دهد که مدل‌های زبانی بزرگ در گفت‌وگوهای تک‌مرحله‌ای عملکرد بهتری از مکالمات چندمرحله‌ای از خود نشان می‌دهند. با‌این‌حال، محققان تأکید می‌کنند که این اختلاف عملکرد بدان‌معنا نیست که مدل‌ها به‌طور ناگهانی «کم‌هوش‌تر» شده‌اند.

به گفته پژوهشگران، توانایی ذاتی مدل‌ها فقط حدود ۱۵ درصد کاهش یافته، اما میزان نامطمئن‌بودن آن‌ها ۱۱۲ درصد افزایش پیدا کرده است. حال دلیل این اتفاق چیست؟ محققان توضیح می‌دهند که مدل‌های هوش مصنوعی اغلب دچار پدیده‌ای به نام تولید زودهنگام می‌شوند؛ یعنی تلاش می‌کنند حتی پیش‌از آنکه کاربر توضیح خود را کامل کند، پاسخی برای پرسش ارائه دهند.

نکته جالب‌تر این است که مدل معمولاً پاسخ اولیه خود را به‌عنوان مبنای پاسخ‌های بعدی در نظر می‌گیرد؛ حتی اگر آن پاسخ اولیه اشتباه بوده باشد. پژوهشگران به پدیده دیگری نیز اشاره کرده‌اند که آن را «تورم پاسخ» نامیده‌اند.

به نوشته ویندوز سنترال، طبق نتایج این مطالعه پاسخ‌های مدل‌ها در گفت‌وگوهای چندمرحله‌ای بین ۲۰ تا ۳۰۰ درصد طولانی‌تر می‌شوند. محققان نشان داده‌اند که پاسخ‌های طولانی‌تر فرضیه‌ها و توهم‌های بیشتری را وارد مکالمه می‌کنند؛ عناصری که نگران‌کننده‌تر آن است که به‌عنوان زمینه دائمی در ادامه گفت‌وگو استفاده می‌شوند.

در نهایت، حتی مدل‌هایی مانند o3 از OpenAI و DeepSeek R1 که به توکن‌های تفکر اضافی مجهز هستند نیز نتوانسته‌اند خود را از این وضعیت عجیب و پیچیده رها کنند.

برچسب‌ها: p6
تارخ ترهنده

تارخ ترهنده

The burning heart never knows surrender.

مطالب مرتبط

بهترین سیستم گیمینگ
بررسی لپ تاپ و کامپیوتر

بهترین سیستم گیمینگ بازار ایران ؛ معرفی ۷ PC گیمینگ از اقتصادی تا RTX 5090

نوشته شده توسط مهدی کریمی صمدی
5 تیر 1405
بهترین کیبورد گیمینگ
پیشنهاد سردبیر

بهترین کیبورد گیمینگ در بازار ایران + راهنمای خرید

نوشته شده توسط مهدی کریمی صمدی
5 تیر 1405
آیا مانیتور دوم بهره_وری را افزایش می_دهد؟
پیشنهاد سردبیر

آیا مانیتور دوم بهره‌وری را افزایش می‌دهد؟ بررسی مزایا و معایب استفاده از دو مانیتور

نوشته شده توسط فاطمه امامی
5 تیر 1405
آموزش

بهترین ابزارهای هوش مصنوعی برای ساخت تصاویر

نوشته شده توسط بشیری
5 تیر 1405
نقد و بررسی ASUS TUF Gaming
بررسی لپ تاپ و کامپیوتر

نقد و بررسی ASUS TUF Gaming (A15/F16)؛ بهترین لپ‌تاپ اقتصادی

نوشته شده توسط مهدی کریمی صمدی
5 تیر 1405
خبر بعدی
نمای پشتی گوشی Realme با طراحی مینیمال و ماژول دوربین دوگانه، قرارگرفته روی صخره در پس‌زمینه ساحل هنگام غروب

گوشی اقتصادی ریلمی P4 لایت با باتری ۶۳۰۰ میلی‌آمپرساعتی معرفی شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

راهنمای تنظیمات مودم

راهنمای جامع تنظیم مودم ADSL، VDSL، TD-LTE و فیبر نوری

29 خرداد 1405 - به‌روزشده در 1 تیر 1405
گوگل نخستین موزه هوش مصنوعی جهان را در لس‌آنجلس افتتاح می‌ کند

گوگل نخستین موزه هوش مصنوعی جهان را در لس‌آنجلس افتتاح می‌ کند

30 خرداد 1405

داغ‌ترین‌های روز

ساخت نخستین ابرآلیاژ جهان با استحکامی دو برابر فولاد

2 تیر 1405
مقایسه پوکو X8 Pro با گلکسی A57

مقایسه گوشی پوکو X8 Pro با گلکسی A57؛ کدام ارزش خرید بیشتری دارد؟

5 تیر 1405
بهترین سیستم گیمینگ

بهترین سیستم گیمینگ بازار ایران ؛ معرفی ۷ PC گیمینگ از اقتصادی تا RTX 5090

5 تیر 1405
بهترین مودم سیم کارت خور

بهترین مودم‌ سیم کارت خور بازار ایران ؛ راهنمای خرید مودم‌های 4G، 5G و TD-LTE

4 تیر 1405
لوگوی رسمی شیائومی هایپراواس ۴ با فونت سفید روی پس‌زمینه انتزاعی مارپیچ به رنگ آبی تیره که عدد بزرگ ۴ را در مرکز نشان می‌دهد

به‌روزرسانی HyperOS 4 با تغییرات بزرگ نرم‌‌افزاری معرفی می‌‌شود

31 خرداد 1405 - به‌روزشده در 1 تیر 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

بهترین سیستم گیمینگ

بهترین سیستم گیمینگ بازار ایران ؛ معرفی ۷ PC گیمینگ از اقتصادی تا RTX 5090

5 تیر 1405
بهترین کیبورد گیمینگ

بهترین کیبورد گیمینگ در بازار ایران + راهنمای خرید

5 تیر 1405
آیا مانیتور دوم بهره_وری را افزایش می_دهد؟

آیا مانیتور دوم بهره‌وری را افزایش می‌دهد؟ بررسی مزایا و معایب استفاده از دو مانیتور

5 تیر 1405

بهترین ابزارهای هوش مصنوعی برای ساخت تصاویر

5 تیر 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir