• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » افت نگران کننده پاسخ های ChatGPT

افت نگران کننده پاسخ های ChatGPT

امیرحسین یونس نوشته شده توسط امیرحسین یونس
پنجشنبه 29 تیر 1402 - 11:16
در اخبار هوش مصنوعی, فناوری
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

بررسی محققان نشان می دهد کیفیت پاسخ های ChatGPT در یک بازه مشخص در سال جاری میلادی افت محسوس و نگران کننده ای داشته است.

به گزارش تکناک، برای مثال دقت شناسایی اعداد اول در ChatGPT-4 از مارچ تا ژوئن ۲۰۲۳ از ۹۷.۶ درصد به ۲.۴ درصد کاهش یافت.

در ماه‌های اخیر، شواهد شخصی و زمزمه‌های کلی درباره کاهش کیفیت پاسخ‌های ChatGPT افزایش یافته است. تیمی از پژوهشگران از دانشگاه استنفورد و دانشگاه کالیفرنیا در برکلی تصمیم گرفتند بررسی کنند که آیا واقعاً کاهشی در کیفیت رخ داده است و معیارهایی برای اندازه‌گیری مقیاس تغییرات نامطلوب ارائه دهند. به طور خلاصه، کاهش در کیفیت ChatGPT مطمئناً تصور نمی شد.

سه محقق مشهور، ماتی زاهاریا، لینجیائو چن و جیمز زو، پشت مقاله‌ تحقیقاتی به تازگی منتشر شده با عنوان چگونه رفتار ChatGPT در طول زمان تغییر می‌کند؟ (PDF) بودند. صبح امروز، پروفسور علوم کامپیوتر در دانشگاه کالیفرنیا، زاهاریا، به توییتر آمد تا یافته‌های تحقیقاتی را به اشتراک بگذارد. او با تأکید شگفت‌انگیزی اعلام کرد که نرخ موفقیت GPT-4 در ‘این عدد اول است؟ به ترتیب مراحل فکر کنید’ از مارس تا ژوئن از ۹۷.۶٪ به ۲.۴٪ کاهش یافته است.

GPT-4 در حدود دو هفته پیش به صورت عمومی در دسترس قرار گرفت و به عنوان پیشرفته‌ترین و تواناترین مدل OpenAI معرفی شد. این مدل به سرعت در دسترس توسعه‌دهندگان API قرار گرفت و ادعا کرد که می‌تواند به عنوان موتوری برای مجموعه‌ای از محصولات هوش مصنوعی نوآورانه استفاده شود. بنابراین، غم‌انگیز و شگفت‌آور است که تحقیقات جدید نشان می‌دهد که در برابر برخی از پرسش‌های بسیار ساده، این مدل در کیفیت پاسخ‌دهی، نتیجه‌ای غیر قابل قبول دارد.

ما در بالا به عنوان مثالی از نرخ شکست بی‌سابقه GPT-4 در پرسش‌های اعداد اول اشاره کرده‌ایم. تیم پژوهشی وظیفه طراحی وظایف را بر عهده داشت تا جنبه‌های کیفی زیرین مدل‌های زبان بزرگ (LLMs) GPT-4 و GPT-3.5 ChatGPT را اندازه‌گیری کند. وظایف به چهار دسته تقسیم شده‌اند و مهارت‌های متنوعی از هوش مصنوعی را اندازه‌گیری می‌کنند در حالی که ارزیابی عملکرد به نسبت ساده هستند.

  • حل مسائل ریاضی
  • پاسخگویی به سؤالات حساس
  • تولید کد
  • استدلال تصویری

یک دید کلی از عملکرد Open AI LLMs در نمودار زیر ارائه شده است. پژوهشگران عملکرد نسخه‌های GPT-4 و GPT-3.5 را در مارس ۲۰۲۳ و ژوئن ۲۰۲۳ ارزیابی کردند.

در این نمودار به وضوح نشان داده شده است که خدمات همان LLM به پرسش‌ها در طول زمان به شکل کاملاً متفاوتی پاسخ می‌دهند. در این دوره نسبتاً کوتاه، تفاوت‌های قابل توجهی مشاهده می‌شود. هنوز مشخص نیست که این LLMs چگونه به‌روزرسانی می‌شوند و آیا تغییرات برای بهبود برخی جنبه‌های عملکردشان ممکن است بر دیگر جنبه‌ها تأثیر منفی داشته باشد یا نه. ببینید چقدر نسخه جدیدتر GPT-4 نسبت به نسخه مارس در سه دسته آزمونی بدتر شده است. این نسخه فقط در استدلال تصویری، با مقدار بسیار کمی برنده است.

ممکن است برخی از افراد نسبت به کیفیت متغیر مشاهده شده در همان نسخه LLM ها بی‌تفاوت باشند. با این حال، پژوهشگران توجه می‌کنند که به دلیل محبوبیت ChatGPT، هر دو GPT-4 و GPT-3.5 توسط کاربران فردی و تعدادی از شرکت‌ها به طور گسترده به‌کار گرفته شده‌اند. بنابراین، فراتر از حد امکان نیست که برخی از اطلاعات تولید شده توسط GPT بر زندگی شما تأثیر بگذارد.

پژوهشگران عزم خود را برای ادامه‌ی ارزیابی نسخه‌های GPT در یک مطالعه بلندمدت اعلام کرده‌اند. شاید شرکت Open AI باید ارزیابی‌های کیفیت منظم خود را برای مشتریان پردرآمد خود نظارت و انتشار دهد. اگر این امر مشخص‌تر نشود، ممکن است برای سازمان‌های تجاری یا دولتی لازم باشد برخی از معیارهای کیفیت اساسی این LLM ها را کنترل کنند که می‌تواند تأثیرات قابل توجهی بر روی صنعت و تحقیقات داشته باشد.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

دوربین Leica Q3 Monochrom به رنگ سیاه، که با یک هود لنز روی یک سطح قهوه‌ای در کنار مجموعه‌ای از عکس‌های چاپ شده سیاه و سفید قرار گرفته است.
دوربین دیجیتال

جدیدترین دوربین سیاه و سفید لایکا با قیمت ۷,۸۰۰ دلار عرضه شد

نوشته شده توسط امیرحسین یونس
29 آبان 1404
المان‌های مکعبی از عناصر خاکی کمیاب (Rare Earth Elements) که نمادهای شیمیایی مانند Nd، Pr و Er روی آن‌ها حک شده است، و بر روی ترکیبی از پرچم‌های ایالات متحده و چین قرار گرفته‌اند.
فناوری

افزایش ۱,۵۰۰ درصدی قیمت ایتریم؛ جنگ تجاری آمریکا و چین بازار مواد کمیاب را به ‌چالش کشید

نوشته شده توسط امیرحسین یونس
29 آبان 1404
یک مرد در حال سخنرانی در یک کنفرانس (AI Summit) در مقابل یک صفحه نمایش آبی تیره با متن "OPENING OF AI SUMMIT" به صورت برجسته.
اخبار هوش مصنوعی

شرکت فنلاندی برای ساخت تجهیزات دفاعی مبتنی‌بر هوش مصنوعی با نوکیا همکاری می‌کند

نوشته شده توسط امیرحسین یونس
29 آبان 1404
نمای نزدیک از چهره یان لکان (Yann LeCun)، دانشمند ارشد هوش مصنوعی متا، با عینک‌های مشکی و موهای خاکستری، که لبخندی ملایم دارد.
اخبار هوش مصنوعی

معمار هوش مصنوعی پس از ۱۲ سال از متا جدا می‌شود

نوشته شده توسط امیرحسین یونس
29 آبان 1404
قسمت داخلی فریم گوشی (احتمالاً iPhone Air) که یک برش از پورت USB-C چاپ سه‌بعدی را نشان می‌دهد، با یک زوم میکروسکوپی در دایره‌ای که بافت مشبک را برجسته می‌کند.
فناوری

افشای راز فناوری پرینت سه‌بعدی اپل؛ تکنیکی الهام‌گرفته از علم پزشکی در قلب آیفون

نوشته شده توسط امیرحسین یونس
29 آبان 1404
خبر بعدی

آسانتر شدن ارسال پیام به شماره ناشناس در واتساپ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

جیپ Recon 2026 پس از سه سال تأخیر سرانجام وارد خط تولید می‌ شود

جیپ Recon 2026 پس از سه سال تأخیر وارد خط تولید می‌ شود + تصویر

28 آبان 1404
ردیفی از کارت‌های رابط کاربری با طراحی رنگارنگ و متن "One UI 8" و "Now coming to your Galaxy" که در پس‌زمینه سفید قرار گرفته‌اند.

انتشار به‌روزرسانی One UI 8 سامسونگ برای این مدل‌ها به تأخیر افتاد

24 آبان 1404 - به‌روزشده در 25 آبان 1404

داغ‌ترین‌های روز

این سه دانشگاه ایرانی در بین برترین های آسیا قرار دارند

این سه دانشگاه ایرانی در بین برترین های آسیا قرار دارند

26 آبان 1404
مایکروسافت Windows را وارد عصر «agentic OS» کرد

مایکروسافت ویندوز را وارد عصر agentic OS کرد

28 آبان 1404
کاسیو سری تمام‌فلزی G-Shock GMW-BZ5000 را معرفی کرد

کاسیو سری تمام‌فلزی G-Shock GMW-BZ5000 را معرفی کرد

24 آبان 1404 - به‌روزشده در 25 آبان 1404

گوگل از مدل هوش مصنوعی جدید Gemini 3 رونمایی کرد

27 آبان 1404 - به‌روزشده در 28 آبان 1404
بهترین کیبوردهای بی‌صدا بازار

تجربه تایپ آرام؛ معرفی بهترین کیبوردهای بی‌صدا در بازار

25 آبان 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

مکایی از مانیتور گیمینگ Skyworth G32U Max در رنگ سفید

مانیتور گیمینگ 4K جدید اسکای‌ورث با نرخ نوسازی ‌۱۶۰ هرتز معرفی شد

29 آبان 1404
نمایی از پردازنده Panther Lake اینتل

اینتل در CES 2026 از تراشه پنتر لیک با فناوری 18A پرده‌برداری می‌کند

29 آبان 1404
نمای نزدیک از یک گوشی اندروید که دکمه "Airplane mode" در منوی تنظیمات سریع آن فعال است و گوشی در یک جیب یا کیف مشکی قرار دارد.

گوگل قابلیت همگام‌سازی «حالت هواپیما» را بین گوشی‌های اندروید و ساعت‌های هوشمند ارائه می‌دهد

29 آبان 1404
دوربین Leica Q3 Monochrom به رنگ سیاه، که با یک هود لنز روی یک سطح قهوه‌ای در کنار مجموعه‌ای از عکس‌های چاپ شده سیاه و سفید قرار گرفته است.

جدیدترین دوربین سیاه و سفید لایکا با قیمت ۷,۸۰۰ دلار عرضه شد

29 آبان 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir