• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » دسته‌بندی نشده » چرا چت‌بات‌ها گیج می‌شوند؟؛ راز افت عملکرد هوش مصنوعی در مکالمات طولانی

چرا چت‌بات‌ها گیج می‌شوند؟؛ راز افت عملکرد هوش مصنوعی در مکالمات طولانی

تارخ ترهنده نوشته شده توسط تارخ ترهنده
جمعه 1 اسفند 1404 - 22:00
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
نمای گوشی هوشمند با آیکون اپلیکیشن‌های هوش مصنوعی از جمله ChatGPT، DeepSeek، Copilot، Gemini و Claude
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

نتایج پژوهش مشترک مایکروسافت و سیلزفورس نشان می‌دهد که افت عملکرد هوش مصنوعی در مکالمات طولانی باعث شده تا دقت مدل‌ها به ۶۵ درصد کاهش یابد.

به گزارش سرویس هوش مصنوعی تک‌ناک، برترین آزمایشگاه‌های پژوهشی هوش مصنوعی در سال‌های اخیر مدل‌های پیشرفته و چت‌بات‌های متعددی را منتشر کرده‌اند تا جایگاه برند خود را در این فضای به‌سرعت درحال تغییر تثبیت کنند با‌این‌حال، کاربران اغلب از این ابزارها شکایت و به پدیده توهم یا ارائه پاسخ‌های کاملا نادرست به پرسش‌ها اشاره می‌کنند.

براساس مقاله‌ای پژوهشی از Microsoft Research و Salesforce که بیش از ۲۰۰ هزار مکالمه از پیشرفته‌ترین مدل‌های زبانی بزرگ هوش مصنوعی ازجمله GPT‑4.1 و Gemini 2.5 Pro و Claude 3.7 Sonnet و o3 و DeepSeek R1 و Llama 4 را تحلیل کرده، مشخص شده است که این ابزارها وقتی وظایف در قالب گفت‌وگوی طبیعی و چندمرحله‌ای مطرح می‌شوند، اغلب در جریان مکالمه گم می‌شوند.

برای درک بهتر موضوع، مدل‌هایی مانند GPT‑4.1 و Gemini 2.5 Pro در مواجهه با پرسشی واحد به نرخ موفقیت حدود ۹۰ درصد دست پیدا می‌کنند. بااین‌حال، همین مدل‌ها در گفت‌وگوهای طولانی‌تر و رفت‌وبرگشتی، افت عملکرد درخورتوجهی را تجربه می‌کنند و میزان موفقیت آن‌ها به حدود ۶۵ درصد کاهش می‌یابد.

هوش مصنوعی مولد در صنعت فناوری عملاً به واژه متداولی تبدیل شده است و تقریباً همه درباره آن صحبت می‌کنند. این فناوری با وجود ادعاهایی مبنی‌بر اینکه حبابی در آستانه ترکیدن است، همچنان در سراسر جهان به‌طور گسترده درحال پذیرش است.

نمای رابط کاربری چت DeepSeek با پیام خوش‌آمدگویی روی صفحه نمایش

در سال ۲۰۲۴، مایکروسافت اعلام کرده بود که ChatGPT برتری خاصی بر کوپایلت ندارد. این شرکت در آن زمان اشاره کرده بود که کاربران از این محصول مطابق انتظار استفاده نمی‌کنند و در عین حال، ضعف در مهارت‌های پرامپت‌نویسی را عامل اصلی این موضوع دانسته بود.

پژوهش جدید نیز در ادامه همین دیدگاه نشان می‌دهد که مدل‌های زبانی بزرگ در گفت‌وگوهای تک‌مرحله‌ای عملکرد بهتری از مکالمات چندمرحله‌ای از خود نشان می‌دهند. با‌این‌حال، محققان تأکید می‌کنند که این اختلاف عملکرد بدان‌معنا نیست که مدل‌ها به‌طور ناگهانی «کم‌هوش‌تر» شده‌اند.

به گفته پژوهشگران، توانایی ذاتی مدل‌ها فقط حدود ۱۵ درصد کاهش یافته، اما میزان نامطمئن‌بودن آن‌ها ۱۱۲ درصد افزایش پیدا کرده است. حال دلیل این اتفاق چیست؟ محققان توضیح می‌دهند که مدل‌های هوش مصنوعی اغلب دچار پدیده‌ای به نام تولید زودهنگام می‌شوند؛ یعنی تلاش می‌کنند حتی پیش‌از آنکه کاربر توضیح خود را کامل کند، پاسخی برای پرسش ارائه دهند.

نکته جالب‌تر این است که مدل معمولاً پاسخ اولیه خود را به‌عنوان مبنای پاسخ‌های بعدی در نظر می‌گیرد؛ حتی اگر آن پاسخ اولیه اشتباه بوده باشد. پژوهشگران به پدیده دیگری نیز اشاره کرده‌اند که آن را «تورم پاسخ» نامیده‌اند.

به نوشته ویندوز سنترال، طبق نتایج این مطالعه پاسخ‌های مدل‌ها در گفت‌وگوهای چندمرحله‌ای بین ۲۰ تا ۳۰۰ درصد طولانی‌تر می‌شوند. محققان نشان داده‌اند که پاسخ‌های طولانی‌تر فرضیه‌ها و توهم‌های بیشتری را وارد مکالمه می‌کنند؛ عناصری که نگران‌کننده‌تر آن است که به‌عنوان زمینه دائمی در ادامه گفت‌وگو استفاده می‌شوند.

در نهایت، حتی مدل‌هایی مانند o3 از OpenAI و DeepSeek R1 که به توکن‌های تفکر اضافی مجهز هستند نیز نتوانسته‌اند خود را از این وضعیت عجیب و پیچیده رها کنند.

برچسب‌ها: p6
تارخ ترهنده

تارخ ترهنده

The burning heart never knows surrender.

مطالب مرتبط

یک تصویر گرافیکی مدرن و انتزاعی از لوگوی یوتیوب. کلمه YouTube با فونت سفید روی یک کادر قرمز بزرگ و منحنی قرار گرفته است. در پس‌زمینه، اشکال هندسی نامنظم به رنگ‌های قرمز، سیاه و سفید دیده می‌شوند که حسی از پویایی و رسانه‌های دیجیتال را منتقل می‌کنند
شبکه های اجتماعی

یوتیوب پیام‌رسانی خصوصی را دوباره فعال کرد

نوشته شده توسط تارخ ترهنده
21 خرداد 1405
نمای نزدیک از یک استابلایزر و گیمبال گوشی هوشمند مشکی رنگ که روی یک سنگ در دشت گل‌های زرد قرار دارد. در پس‌زمینه، کوه‌های پوشیده از برف زیر آسمان آبی دیده می‌شوند. صفحه نمایش کوچک روی دسته‌ی گیمبال، تصویر منظره را نشان می‌دهد
دوربین دیجیتال

دوربین گیمبال Luna Ultra اینستا با سنسور 8K وارد بازار شد

نوشته شده توسط تارخ ترهنده
21 خرداد 1405
تصویرسازی هنری از سیاه‌چاله کلان‌جرم Sagittarius A* در مرکز کهکشان راه شیری با دیسک برافزایشی درخشان و ابرهای گازی پیرامون آن.
پیشنهاد سردبیر

راز ۵۰ ساله سیاه‌چاله مرکز راه شیری فاش شد

نوشته شده توسط نرگس چالوک
21 خرداد 1405
دستیار هوش مصنوعی جمینای برای مشاغل
اخبار هوش مصنوعی

جمینای به ابزار مدیریت کسب‌وکار مجهز شد

نوشته شده توسط سید محمد برازنده
21 خرداد 1405
هوش مصنوعی برای وکلا
اخبار هوش مصنوعی

دادگاه آمریکا به وکلایی که از هوش مصنوعی استفاده می‌کنند هشدار جدی داد

نوشته شده توسط مانی
21 خرداد 1405
خبر بعدی
نمای پشتی گوشی Realme با طراحی مینیمال و ماژول دوربین دوگانه، قرارگرفته روی صخره در پس‌زمینه ساحل هنگام غروب

گوشی اقتصادی ریلمی P4 لایت با باتری ۶۳۰۰ میلی‌آمپرساعتی معرفی شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

مردم نگران نباشند،اینترنت قطع نمی شود

مردم نگران نباشند،اینترنت قطع نمی شود

18 خرداد 1405
چرا این برنامه باستانی هنوز از ویندوز ۱۱ حذف نشده است؟

چرا این برنامه باستانی هنوز از ویندوز ۱۱ حذف نشده است؟

26 اردیبهشت 1405

داغ‌ترین‌های روز

نخستین جنگنده دوکابینه Gripen F جهان رونمایی شد

نخستین جنگنده دوکابینه Gripen F جهان رونمایی شد

19 خرداد 1405 - به‌روزشده در 20 خرداد 1405
نصب موتور Pratt & Whitney F135 روی نخستین جنگنده رادارگریز F-35A آلمان در خط مونتاژ نهایی شرکت Lockheed Martin

نخستین جنگنده F-35A آلمان وارد مرحله نهایی تولید شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
تارا بهتر است یا دنا پلاس؟ مقایسه کامل مشخصات، مزایا، معایب و ارزش خرید

تارا بهتر است یا دنا پلاس؟ + مزایا، معایب و ارزش خرید

14 خرداد 1405 - به‌روزشده در 17 خرداد 1405
آیفون 17 پرو مکس سفارشی کاویار با طراحی الهام‌گرفته از ساعت‌های نجومی لوکس در جعبه اختصاصی آبی‌رنگ.

آیفون 17 پرومکس کاویار با محفظه اختصاصی ساعت سوئیسی رونمایی شد

16 خرداد 1405 - به‌روزشده در 17 خرداد 1405
حقوق پخش جام جهانی ۲۰۲۶ به چه رسانه‌هایی رسید؟؛ فهرست کامل رسانه‌های رسمی جام جهان FIFA

رسانه‌های رسمی جام جهانی ۲۰۲۶ مشخص شدند

18 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

یک تصویر گرافیکی مدرن و انتزاعی از لوگوی یوتیوب. کلمه YouTube با فونت سفید روی یک کادر قرمز بزرگ و منحنی قرار گرفته است. در پس‌زمینه، اشکال هندسی نامنظم به رنگ‌های قرمز، سیاه و سفید دیده می‌شوند که حسی از پویایی و رسانه‌های دیجیتال را منتقل می‌کنند

یوتیوب پیام‌رسانی خصوصی را دوباره فعال کرد

21 خرداد 1405
افزایش قیمت کامپیوترهای لنوو به‌دلیل حافظه

لنوو به‌دلیل گرانی رم قیمت رایانه های شخصی را افزایش می دهد

21 خرداد 1405
نمای نزدیک از یک استابلایزر و گیمبال گوشی هوشمند مشکی رنگ که روی یک سنگ در دشت گل‌های زرد قرار دارد. در پس‌زمینه، کوه‌های پوشیده از برف زیر آسمان آبی دیده می‌شوند. صفحه نمایش کوچک روی دسته‌ی گیمبال، تصویر منظره را نشان می‌دهد

دوربین گیمبال Luna Ultra اینستا با سنسور 8K وارد بازار شد

21 خرداد 1405
مینی‌ون پرچمدار Maextro V800 در نمای سه‌رخ با طراحی لوکس، بدنه دو رنگ و فناوری‌های هوشمند Huawei

مینی‌ون فوق‌لوکس Maextro V800 رونمایی شد

21 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir