• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » دسته‌بندی نشده » چرا چت‌بات‌ها گیج می‌شوند؟؛ راز افت عملکرد هوش مصنوعی در مکالمات طولانی

چرا چت‌بات‌ها گیج می‌شوند؟؛ راز افت عملکرد هوش مصنوعی در مکالمات طولانی

تارخ ترهنده نوشته شده توسط تارخ ترهنده
جمعه 1 اسفند 1404 - 22:00
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
نمای گوشی هوشمند با آیکون اپلیکیشن‌های هوش مصنوعی از جمله ChatGPT، DeepSeek، Copilot، Gemini و Claude
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

نتایج پژوهش مشترک مایکروسافت و سیلزفورس نشان می‌دهد که افت عملکرد هوش مصنوعی در مکالمات طولانی باعث شده تا دقت مدل‌ها به ۶۵ درصد کاهش یابد.

به گزارش سرویس هوش مصنوعی تک‌ناک، برترین آزمایشگاه‌های پژوهشی هوش مصنوعی در سال‌های اخیر مدل‌های پیشرفته و چت‌بات‌های متعددی را منتشر کرده‌اند تا جایگاه برند خود را در این فضای به‌سرعت درحال تغییر تثبیت کنند با‌این‌حال، کاربران اغلب از این ابزارها شکایت و به پدیده توهم یا ارائه پاسخ‌های کاملا نادرست به پرسش‌ها اشاره می‌کنند.

براساس مقاله‌ای پژوهشی از Microsoft Research و Salesforce که بیش از ۲۰۰ هزار مکالمه از پیشرفته‌ترین مدل‌های زبانی بزرگ هوش مصنوعی ازجمله GPT‑4.1 و Gemini 2.5 Pro و Claude 3.7 Sonnet و o3 و DeepSeek R1 و Llama 4 را تحلیل کرده، مشخص شده است که این ابزارها وقتی وظایف در قالب گفت‌وگوی طبیعی و چندمرحله‌ای مطرح می‌شوند، اغلب در جریان مکالمه گم می‌شوند.

برای درک بهتر موضوع، مدل‌هایی مانند GPT‑4.1 و Gemini 2.5 Pro در مواجهه با پرسشی واحد به نرخ موفقیت حدود ۹۰ درصد دست پیدا می‌کنند. بااین‌حال، همین مدل‌ها در گفت‌وگوهای طولانی‌تر و رفت‌وبرگشتی، افت عملکرد درخورتوجهی را تجربه می‌کنند و میزان موفقیت آن‌ها به حدود ۶۵ درصد کاهش می‌یابد.

هوش مصنوعی مولد در صنعت فناوری عملاً به واژه متداولی تبدیل شده است و تقریباً همه درباره آن صحبت می‌کنند. این فناوری با وجود ادعاهایی مبنی‌بر اینکه حبابی در آستانه ترکیدن است، همچنان در سراسر جهان به‌طور گسترده درحال پذیرش است.

نمای رابط کاربری چت DeepSeek با پیام خوش‌آمدگویی روی صفحه نمایش

در سال ۲۰۲۴، مایکروسافت اعلام کرده بود که ChatGPT برتری خاصی بر کوپایلت ندارد. این شرکت در آن زمان اشاره کرده بود که کاربران از این محصول مطابق انتظار استفاده نمی‌کنند و در عین حال، ضعف در مهارت‌های پرامپت‌نویسی را عامل اصلی این موضوع دانسته بود.

پژوهش جدید نیز در ادامه همین دیدگاه نشان می‌دهد که مدل‌های زبانی بزرگ در گفت‌وگوهای تک‌مرحله‌ای عملکرد بهتری از مکالمات چندمرحله‌ای از خود نشان می‌دهند. با‌این‌حال، محققان تأکید می‌کنند که این اختلاف عملکرد بدان‌معنا نیست که مدل‌ها به‌طور ناگهانی «کم‌هوش‌تر» شده‌اند.

به گفته پژوهشگران، توانایی ذاتی مدل‌ها فقط حدود ۱۵ درصد کاهش یافته، اما میزان نامطمئن‌بودن آن‌ها ۱۱۲ درصد افزایش پیدا کرده است. حال دلیل این اتفاق چیست؟ محققان توضیح می‌دهند که مدل‌های هوش مصنوعی اغلب دچار پدیده‌ای به نام تولید زودهنگام می‌شوند؛ یعنی تلاش می‌کنند حتی پیش‌از آنکه کاربر توضیح خود را کامل کند، پاسخی برای پرسش ارائه دهند.

نکته جالب‌تر این است که مدل معمولاً پاسخ اولیه خود را به‌عنوان مبنای پاسخ‌های بعدی در نظر می‌گیرد؛ حتی اگر آن پاسخ اولیه اشتباه بوده باشد. پژوهشگران به پدیده دیگری نیز اشاره کرده‌اند که آن را «تورم پاسخ» نامیده‌اند.

به نوشته ویندوز سنترال، طبق نتایج این مطالعه پاسخ‌های مدل‌ها در گفت‌وگوهای چندمرحله‌ای بین ۲۰ تا ۳۰۰ درصد طولانی‌تر می‌شوند. محققان نشان داده‌اند که پاسخ‌های طولانی‌تر فرضیه‌ها و توهم‌های بیشتری را وارد مکالمه می‌کنند؛ عناصری که نگران‌کننده‌تر آن است که به‌عنوان زمینه دائمی در ادامه گفت‌وگو استفاده می‌شوند.

در نهایت، حتی مدل‌هایی مانند o3 از OpenAI و DeepSeek R1 که به توکن‌های تفکر اضافی مجهز هستند نیز نتوانسته‌اند خود را از این وضعیت عجیب و پیچیده رها کنند.

برچسب‌ها: p6
تارخ ترهنده

تارخ ترهنده

The burning heart never knows surrender.

مطالب مرتبط

ساعات کاری دستگاه‌های اجرایی ۲۶ اردیبهشت اعلام شد
اخبار داخلی

ساعت کاری دستگاه‌های اجرایی از ۲۶ اردیبهشت اعلام شد

نوشته شده توسط مجتبی علی مردانی
22 اردیبهشت 1405
پیشنهاد سردبیر

نخستین آزمایشگاه پزشکی بدون نیروی انسانی در ژاپن آغاز به کار کرد

نوشته شده توسط نرگس چالوک
22 اردیبهشت 1405
وب‌سایت دیگ با تمرکز بر پوشش اخبار هوش مصنوعی دوباره فعال می‌ شود
اخبار هوش مصنوعی

وب‌سایت دیگ با تمرکز بر پوشش اخبار هوش مصنوعی دوباره فعال می‌ شود

نوشته شده توسط تارخ ترهنده
22 اردیبهشت 1405
نمایی از تلسکوپ فضایی جیمز وب ناسا در کنار تصویری از سحابی و ستارگان ثبت‌شده توسط این تلسکوپ
پیشنهاد سردبیر

تلسکوپ جیمز وب دقیق‌ترین نقشه شبکه کیهانی جهان را ثبت کرد

نوشته شده توسط نرگس چالوک
22 اردیبهشت 1405
لوگوی Baidu روی صفحه نمایش یک گوشی هوشمند، نماد برند موتور جست‌وجو و فناوری چینی بایدو.
اخبار هوش مصنوعی

مدل جدید هوش مصنوعی بایدو ارزان‌تر و قوی‌تر از رقبا ظاهر شد

نوشته شده توسط تارخ ترهنده
22 اردیبهشت 1405
خبر بعدی
نمای پشتی گوشی Realme با طراحی مینیمال و ماژول دوربین دوگانه، قرارگرفته روی صخره در پس‌زمینه ساحل هنگام غروب

گوشی اقتصادی ریلمی P4 لایت با باتری ۶۳۰۰ میلی‌آمپرساعتی معرفی شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

تصویر رندر iPhone 18 Pro در رنگ Deep Red شامل نمای پشت با ماژول دوربین سه‌گانه و فلش، و نمای جلو با نمایشگر تمام‌صفحه و طراحی Dynamic Island؛ متن iPhone 18 Pro in Deep Red در بالای تصویر دیده می‌شود

آیفون ۱۸ پرو احتمالاً با این رنگ خاص وارد بازار می‌شود

24 فروردین 1405 - به‌روزشده در 22 اردیبهشت 1405

زیردریایی انتحاری بدون‌سرنشین جدید ترکیه رونمایی شد

17 اردیبهشت 1405

داغ‌ترین‌های روز

این رایانه در ابعاد یک کارت اعتباری با ضخامت ۱ میلی‌متری ساخته می‌ شود

این رایانه عجیب فقط یک میلی‌متر ضخامت دارد

21 اردیبهشت 1405 - به‌روزشده در 22 اردیبهشت 1405
چین از نخستین رایانه کوانتومی دوهسته‌ای جهان رونمایی کرد

چین از نخستین رایانه کوانتومی دوهسته‌ای جهان رونمایی کرد

21 اردیبهشت 1405 - به‌روزشده در 22 اردیبهشت 1405
اسلحه پنهان ایران در تنگه هرمز رونمایی شد!

اسلحه پنهان ایران در تنگه هرمز رونمایی شد!

20 اردیبهشت 1405
نسخه جدید لینوکس با انبوهی از پچ‌های تولیدشده توسط AI منتشر شد

نسخه جدید لینوکس با انبوهی از پچ‌های تولیدشده توسط AI منتشر شد

21 اردیبهشت 1405
لنوو از ربات رومیزی مجهز به پروژکتور رونمایی کرد

لنوو از ربات رومیزی مجهز به پروژکتور رونمایی کرد + ویدیو

21 اردیبهشت 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

ساعات کاری دستگاه‌های اجرایی ۲۶ اردیبهشت اعلام شد

ساعت کاری دستگاه‌های اجرایی از ۲۶ اردیبهشت اعلام شد

22 اردیبهشت 1405
سامسونگ به انتشار نسخه بتای One UI 9 نزدیک می‌ شود

سامسونگ به انتشار نسخه بتای One UI 9 نزدیک می‌ شود

22 اردیبهشت 1405

نخستین آزمایشگاه پزشکی بدون نیروی انسانی در ژاپن آغاز به کار کرد

22 اردیبهشت 1405
سامسونگ برای کاهش هزینه‌ها تولید بخشی از نمایشگر S27 را واگذار می‌ کند

سامسونگ برای کاهش هزینه‌ها تولید بخشی از نمایشگر S27 را واگذار می‌ کند

22 اردیبهشت 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir