• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » چرا چت‌بات‌ها گیج می‌شوند؟؛ راز افت عملکرد هوش مصنوعی در مکالمات طولانی

چرا چت‌بات‌ها گیج می‌شوند؟؛ راز افت عملکرد هوش مصنوعی در مکالمات طولانی

تارخ ترهنده نوشته شده توسط تارخ ترهنده
جمعه 1 اسفند 1404 - 22:00
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
نمای گوشی هوشمند با آیکون اپلیکیشن‌های هوش مصنوعی از جمله ChatGPT، DeepSeek، Copilot، Gemini و Claude
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

نتایج پژوهش مشترک مایکروسافت و سیلزفورس نشان می‌دهد که افت عملکرد هوش مصنوعی در مکالمات طولانی باعث شده تا دقت مدل‌ها به ۶۵ درصد کاهش یابد.

به گزارش سرویس هوش مصنوعی تک‌ناک، برترین آزمایشگاه‌های پژوهشی هوش مصنوعی در سال‌های اخیر مدل‌های پیشرفته و چت‌بات‌های متعددی را منتشر کرده‌اند تا جایگاه برند خود را در این فضای به‌سرعت درحال تغییر تثبیت کنند با‌این‌حال، کاربران اغلب از این ابزارها شکایت و به پدیده توهم یا ارائه پاسخ‌های کاملا نادرست به پرسش‌ها اشاره می‌کنند.

براساس مقاله‌ای پژوهشی از Microsoft Research و Salesforce که بیش از ۲۰۰ هزار مکالمه از پیشرفته‌ترین مدل‌های زبانی بزرگ هوش مصنوعی ازجمله GPT‑4.1 و Gemini 2.5 Pro و Claude 3.7 Sonnet و o3 و DeepSeek R1 و Llama 4 را تحلیل کرده، مشخص شده است که این ابزارها وقتی وظایف در قالب گفت‌وگوی طبیعی و چندمرحله‌ای مطرح می‌شوند، اغلب در جریان مکالمه گم می‌شوند.

برای درک بهتر موضوع، مدل‌هایی مانند GPT‑4.1 و Gemini 2.5 Pro در مواجهه با پرسشی واحد به نرخ موفقیت حدود ۹۰ درصد دست پیدا می‌کنند. بااین‌حال، همین مدل‌ها در گفت‌وگوهای طولانی‌تر و رفت‌وبرگشتی، افت عملکرد درخورتوجهی را تجربه می‌کنند و میزان موفقیت آن‌ها به حدود ۶۵ درصد کاهش می‌یابد.

هوش مصنوعی مولد در صنعت فناوری عملاً به واژه متداولی تبدیل شده است و تقریباً همه درباره آن صحبت می‌کنند. این فناوری با وجود ادعاهایی مبنی‌بر اینکه حبابی در آستانه ترکیدن است، همچنان در سراسر جهان به‌طور گسترده درحال پذیرش است.

نمای رابط کاربری چت DeepSeek با پیام خوش‌آمدگویی روی صفحه نمایش

در سال ۲۰۲۴، مایکروسافت اعلام کرده بود که ChatGPT برتری خاصی بر کوپایلت ندارد. این شرکت در آن زمان اشاره کرده بود که کاربران از این محصول مطابق انتظار استفاده نمی‌کنند و در عین حال، ضعف در مهارت‌های پرامپت‌نویسی را عامل اصلی این موضوع دانسته بود.

پژوهش جدید نیز در ادامه همین دیدگاه نشان می‌دهد که مدل‌های زبانی بزرگ در گفت‌وگوهای تک‌مرحله‌ای عملکرد بهتری از مکالمات چندمرحله‌ای از خود نشان می‌دهند. با‌این‌حال، محققان تأکید می‌کنند که این اختلاف عملکرد بدان‌معنا نیست که مدل‌ها به‌طور ناگهانی «کم‌هوش‌تر» شده‌اند.

به گفته پژوهشگران، توانایی ذاتی مدل‌ها فقط حدود ۱۵ درصد کاهش یافته، اما میزان نامطمئن‌بودن آن‌ها ۱۱۲ درصد افزایش پیدا کرده است. حال دلیل این اتفاق چیست؟ محققان توضیح می‌دهند که مدل‌های هوش مصنوعی اغلب دچار پدیده‌ای به نام تولید زودهنگام می‌شوند؛ یعنی تلاش می‌کنند حتی پیش‌از آنکه کاربر توضیح خود را کامل کند، پاسخی برای پرسش ارائه دهند.

نکته جالب‌تر این است که مدل معمولاً پاسخ اولیه خود را به‌عنوان مبنای پاسخ‌های بعدی در نظر می‌گیرد؛ حتی اگر آن پاسخ اولیه اشتباه بوده باشد. پژوهشگران به پدیده دیگری نیز اشاره کرده‌اند که آن را «تورم پاسخ» نامیده‌اند.

به نوشته ویندوز سنترال، طبق نتایج این مطالعه پاسخ‌های مدل‌ها در گفت‌وگوهای چندمرحله‌ای بین ۲۰ تا ۳۰۰ درصد طولانی‌تر می‌شوند. محققان نشان داده‌اند که پاسخ‌های طولانی‌تر فرضیه‌ها و توهم‌های بیشتری را وارد مکالمه می‌کنند؛ عناصری که نگران‌کننده‌تر آن است که به‌عنوان زمینه دائمی در ادامه گفت‌وگو استفاده می‌شوند.

در نهایت، حتی مدل‌هایی مانند o3 از OpenAI و DeepSeek R1 که به توکن‌های تفکر اضافی مجهز هستند نیز نتوانسته‌اند خود را از این وضعیت عجیب و پیچیده رها کنند.

برچسب‌ها: p6
تارخ ترهنده

تارخ ترهنده

The burning heart never knows surrender.

مطالب مرتبط

لوگوی Amazon نصب‌شده روی نمای بیرونی ساختمان، نمایش برند آمازون در محیط شهری
اخبار هوش مصنوعی

عامل قطعی ۱۳ ساعته سرویس AWS مشخص شد

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
تصویر گرافیکی اندروید ۱۷ در کنار لوگوی شیائومی، اشاره به دریافت به‌روزرسانی Android 17 برای دستگاه‌های Xiaomi
رویداد ها

آپدیت اندروید ۱۷ شیائومی هم‌زمان با برگزاری رویداد Google I/O منتشر می‌شود

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
تصویر مفهومی از ارتباط ماهواره‌ای اپل که در آن یک آیفون سیگنال نوری را به یک ماهواره در فضا ارسال می‌کند
اینترنت و شبکه

اپل در حال تولید قابی ویژه برای تقویت اتصال ماهواره‌ای آیفون است

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
نمای پشتی گوشی Realme با طراحی مینیمال و ماژول دوربین دوگانه، قرارگرفته روی صخره در پس‌زمینه ساحل هنگام غروب
پیشنهاد سردبیر

گوشی اقتصادی ریلمی P4 لایت با باتری ۶۳۰۰ میلی‌آمپرساعتی معرفی شد

نوشته شده توسط تارخ ترهنده
1 اسفند 1404
تایپوگرافی سفید رنگ عبارت "One UI 9" با عدد ۹ رنگی در پس‌زمینه تیره و انتزاعی.
پیشنهاد سردبیر

افشای One UI 9 سامسونگ؛ قابلیت «پرسش از هوش مصنوعی» و تغییرات بصری در راه است

نوشته شده توسط امیرحسین یونس
1 اسفند 1404
خبر بعدی
نمای پشتی گوشی Realme با طراحی مینیمال و ماژول دوربین دوگانه، قرارگرفته روی صخره در پس‌زمینه ساحل هنگام غروب

گوشی اقتصادی ریلمی P4 لایت با باتری ۶۳۰۰ میلی‌آمپرساعتی معرفی شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

واتساپ تنظیمات امنیتی سخت‌گیرانه‌تری معرفی می کند

واتساپ تنظیمات امنیتی سخت‌گیرانه‌تری معرفی می کند + ویدیو

8 بهمن 1404
اینستاگرام قابلیت خروج از لیست دوستان نزدیک را فراهم می‌ کند

اینستاگرام قابلیت خروج از لیست دوستان نزدیک را فراهم می‌ کند

11 بهمن 1404

داغ‌ترین‌های روز

مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

28 بهمن 1404 - به‌روزشده در 29 بهمن 1404
بحران کمبود رم

خطر ورشکستگی گسترده در صنعت فناوری؛ بحران کمبود رم قربانی می‌گیرد

28 بهمن 1404
بهترین گوشی های کارکرده

این گوشی‌های کارکرده هنوز ارزش خرید دارند!

26 بهمن 1404 - به‌روزشده در 27 بهمن 1404
تصویر تبلیغاتی و مفهومی از تراشه Exynos 2600 سامسونگ با درخششی آبی‌رنگ در پس‌زمینه تاریک. ذرات نور و جلوه‌های گرافیکی به‌صورت موج‌دار در اطراف تراشه پخش شده‌اند تا قدرت گرافیکی و معماری پردازشی پیشرفته را نمایش دهند. لوگوی 5G روی تراشه و نور مرکزی آن، حس انرژی و فناوری سطح بالا را منتقل می‌کند.

پادشاه جدید گرافیک موبایل؛ درخشش خیره‌کننده تراشه اگزینوس ۲۶۰۰ در رهگیری پرتو

28 بهمن 1404
Coyote Block 3 با سلاح الکترومغناطیسی، دسته پهپادی را در آزمایش ارتش آمریکا سرنگون کر

پهپاد کایوت دسته‌های پهپادی را با سلاح الکترومغناطیسی رهگیری و نابود می‌کند

28 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

لوگوی Amazon نصب‌شده روی نمای بیرونی ساختمان، نمایش برند آمازون در محیط شهری

عامل قطعی ۱۳ ساعته سرویس AWS مشخص شد

1 اسفند 1404
نمای محیط Notepad جدید در ویندوز با نوار ابزار قالب‌بندی، امکان افزودن تصویر، جدول و متن غنی در ویرایشگر

مایکروسافت پشتیبانی از تصاویر را به نوت پد ویندوز اضافه می‌کند

1 اسفند 1404
تصویر گرافیکی اندروید ۱۷ در کنار لوگوی شیائومی، اشاره به دریافت به‌روزرسانی Android 17 برای دستگاه‌های Xiaomi

آپدیت اندروید ۱۷ شیائومی هم‌زمان با برگزاری رویداد Google I/O منتشر می‌شود

1 اسفند 1404
تصویر مفهومی از ارتباط ماهواره‌ای اپل که در آن یک آیفون سیگنال نوری را به یک ماهواره در فضا ارسال می‌کند

اپل در حال تولید قابی ویژه برای تقویت اتصال ماهواره‌ای آیفون است

1 اسفند 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir