• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » آیا تصمیم اپل برای انتخاب ChatGPT درست بوده است؟

آیا تصمیم اپل برای انتخاب ChatGPT درست بوده است؟

اسما کلهر نوشته شده توسط اسما کلهر
سه شنبه 21 اسفند 1403 - 18:20
در اخبار هوش مصنوعی, فناوری
آیا اپل برای انتخاب ChatGPT انتخاب درستی داشته است؟
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. چرا چت‌بات‌های هوش مصنوعی جایگزین مناسبی برای جستجوی وب نیستند؟
  • 2. ارزیابی عملکرد هشت چت‌بات در جستجوی اطلاعات واقعی
  • 3. آزمون ساده‌ای که چت‌بات‌ها در آن شکست خوردند
  • 4. نتایج نگران‌کننده: چت‌بات‌ها کمتر از ۴۰ درصد مواقع پاسخ درستی ارائه دادند
  • 5. دیگر یافته‌های کلیدی پژوهش
  • 6. چرا اپل تصمیم درستی گرفت؟
  • 7. نتیجه‌گیری: چت‌بات‌های هوش مصنوعی برای جستجوی اطلاعات واقعی قابل اعتماد نیستند

یک مطالعه جدید نشان داده است که چت‌بات‌های هوش مصنوعی همچنان قابل اعتماد نیستند، اما اپل با رویکرد خود در این حوزه تصمیم درستی گرفته است.

به گزارش تکناک، این تحقیق نشان می‌دهد که مدل‌های هوش مصنوعی در برخی موارد پاسخ‌های نادرست یا گمراه‌کننده ارائه می‌دهند، درحالی‌که اپل با تمرکز بر کنترل کیفیت و یکپارچگی داده‌ها، استراتژی بهتری را اتخاذ کرده است.

یکی از مهم‌ترین توصیه‌هایی که درباره چت‌بات‌های هوش مصنوعی باید همواره در نظر داشت، این است که «برای یافتن اطلاعات دقیق به آن‌ها تکیه نکنید این ابزارها کاملاً غیرقابل اعتماد هستند.»

نتایج یک پژوهش جدید بار دیگر این مسئله را تأیید کرده است. بااین‌حال، همین مطالعه نشان می‌دهد که اپل با انتخاب ChatGPT شرکت OpenAI برای پاسخ‌گویی به پرسش‌هایی که سیری قادر به پاسخ دادن به آن‌ها نیست، تصمیم درستی گرفته است.

01
از 07
چرا چت‌بات‌های هوش مصنوعی جایگزین مناسبی برای جستجوی وب نیستند؟

مدل‌های زبانی بزرگ مانند ChatGPT، Gemini و Grok دو مشکل اساسی دارند:

  • این مدل‌ها اغلب پاسخ‌های نادرستی ارائه می‌دهند.
  • معمولاً با اطمینان کامل، اطلاعات نادرست خود را به‌عنوان واقعیت مطرح می‌کنند.

به نقل از 9to5mac، بررسی‌ای که Columbia Journalism Review به آن استناد کرده است، نشان می‌دهد حتی زمانی که چت‌بات‌ها با یک نقل‌قول دقیق از یک مقاله خبری تغذیه شده و از آن‌ها خواسته می‌شود جزئیات بیشتری ارائه دهند، بیشتر پاسخ‌های آن‌ها اشتباه است.

02
از 07
ارزیابی عملکرد هشت چت‌بات در جستجوی اطلاعات واقعی

پژوهشگران Tow Center for Digital Journalism عملکرد هشت چت‌بات هوش مصنوعی را که مدعی توانایی جستجوی زنده در وب هستند، مورد بررسی قرار دادند. این چت‌بات‌ها عبارت‌اند از:

  • ChatGPT
  • Perplexity
  • Perplexity Pro
  • DeepSeek
  • Copilot (مایکروسافت)
  • Grok-2
  • Grok-3
  • Gemini

03
از 07
آزمون ساده‌ای که چت‌بات‌ها در آن شکست خوردند

محققان از چت‌بات‌ها خواستند تا بر اساس یک نقل‌قول مشخص، مقاله‌ای را به‌صورت آنلاین پیدا کرده و علاوه بر لینک، عنوان مقاله، نام ناشر و تاریخ انتشار را ارائه دهند.

برای اطمینان از امکان انجام این کار، آن‌ها نقل‌قول‌هایی را انتخاب کردند که منبع اصلی آن‌ها در میان سه نتیجه نخست جستجوی گوگل قرار داشت.

چت‌بات‌ها بر اساس میزان دقت پاسخ‌هایشان در پنج دسته قرار گرفتند:

  1. کاملاً درست
  2. درست اما با اطلاعات ناقص
  3. تا حدودی نادرست
  4. کاملاً نادرست
  5. ناتوان در ارائه پاسخ

همچنین بررسی شد که این ابزارها پاسخ‌های خود را با چه میزان اطمینان ارائه می‌دهند؛ آیا آن‌ها نتایج را به‌عنوان حقیقت مسلم نمایش می‌دهند یا از عباراتی مانند «به نظر می‌رسد» استفاده می‌کنند و به محدودیت‌های خود اذعان دارند؟

04
از 07
نتایج نگران‌کننده: چت‌بات‌ها کمتر از ۴۰ درصد مواقع پاسخ درستی ارائه دادند

میانگین دقت پاسخ‌های این چت‌بات‌ها کمتر از ۴۰ درصد بود. در این میان، Perplexity با نرخ موفقیت ۶۳٪ بهترین عملکرد را داشت، درحالی‌که Grok-3 متعلق به ایکس (توییتر سابق) با تنها ۶٪، بدترین نتیجه را ثبت کرد.

نتایج نگران‌کننده: چت‌بات‌ها کمتر از ۴۰٪ مواقع پاسخ درستی ارائه دادند

05
از 07
دیگر یافته‌های کلیدی پژوهش

  • چت‌بات‌ها معمولاً به‌جای رد پرسش‌هایی که قادر به پاسخ‌گویی به آن‌ها نیستند، اطلاعات نادرست یا حدسی ارائه می‌دهند.
  • چت‌بات‌های پولی با اطمینان بیشتری اطلاعات نادرست منتشر می‌کنند.
  • برخی از چت‌بات‌ها پروتکل Robot Exclusion را که برای جلوگیری از خزیدن ربات‌ها در سایت‌ها طراحی شده، نادیده می‌گیرند.
  • ابزارهای جستجوی مولد در برخی موارد لینک‌های جعلی ساخته و نسخه‌های کپی‌شده مقالات را به‌عنوان منبع ارائه می‌دهند.
  • قراردادهای رسمی میان شرکت‌های خبری و پلتفرم‌های هوش مصنوعی، تضمینی برای صحت استنادها در پاسخ‌های چت‌بات‌ها نیست.

06
از 07
چرا اپل تصمیم درستی گرفت؟

با وجود عملکرد برتر Perplexity، شواهدی نشان می‌دهد که این چت‌بات ممکن است از روش‌های غیرمجاز استفاده کرده باشد. ناشران می‌توانند با استفاده از فایل robots.txt مانع از دسترسی چت‌بات‌ها به محتوای سایت خود شوند. به‌عنوان مثال، National Geographic چنین محدودیتی اعمال کرده است، اما بااین‌حال، Perplexity توانسته تمام ۱۰ نقل‌قول مورد بررسی را از این سایت پیدا کند، درحالی‌که مقالات آن پشت دیوار پرداخت بوده و هیچ توافق‌نامه‌ای میان طرفین وجود نداشته است.

در میان سایر چت‌بات‌ها، ChatGPT بالاترین دقت را داشت یا بهتر است بگوییم، کمترین میزان خطا را داشت.

07
از 07
نتیجه‌گیری: چت‌بات‌های هوش مصنوعی برای جستجوی اطلاعات واقعی قابل اعتماد نیستند

مطالعه انجام‌شده بار دیگر مسئله‌ای را که پیش‌تر نیز روشن بود، تأیید می‌کند: چت‌بات‌های هوش مصنوعی ابزاری مفید برای ایده‌پردازی و الهام گرفتن هستند، اما نباید برای دریافت پاسخ‌های دقیق و واقعی به آن‌ها اعتماد کرد.

اسما کلهر

اسما کلهر

دانش آموخته مترجمی زبان انگلیسی ،نویسنده حوزه تکنولوژی

مطالب مرتبط

دو جنگنده اف-۳۵ خاکستری‌رنگ در حال پرواز در ارتفاع بالا بر فراز ابرها در آرایش دوتایی کنار یکدیگر دیده می‌شوند.
فناوری

وزیر دفاع هلند: جنگنده F-35 را می‌توان مانند آیفون جیلبریک کرد

نوشته شده توسط نرگس چالوک
27 بهمن 1404
پیتر اشتاینبرگر، خالق OpenClaw به تیم OpenAI می‌ پیوندد
اخبار هوش مصنوعی

پیتر اشتاینبرگر، خالق OpenClaw به تیم OpenAI می‌ پیوندد

نوشته شده توسط مانی
27 بهمن 1404
ربات انسان‌نمای L7 چین رقص شمشیر سنتی را با دقت بی‌نظیر اجرا کرد
رباتیک

ربات انسان‌نمای L7 چین رقص شمشیر سنتی را با دقت بی‌نظیر اجرا کرد + ویدیو

نوشته شده توسط مانی
27 بهمن 1404
نمای نزدیک موتور لگویی در حال چرخش با سیم‌پیچ سبزرنگ، روتور آهنربایی و دست کاربر در حال چرخاندن محور جانبی
پیشنهاد سردبیر

تبدیل قطعات لگو به موتور الکتریکی با ۱۳۰۰ دور در دقیقه

نوشته شده توسط نرگس چالوک
27 بهمن 1404
سیستم HoloRadar ایمنی خودروهای خودران و ربات‌ها را افزایش می‌ دهد
فناوری

سیستم HoloRadar ایمنی خودروهای خودران و ربات‌ها را افزایش می‌ دهد

نوشته شده توسط مانی
27 بهمن 1404
خبر بعدی
به‌روزرسانی سیستم پلی در ماه مارس؛ ارتقای تجربه کاربری در پلی استور و خانه هوشمند

ارتقای تجربه کاربری در پلی استور و خانه هوشمند در بروزرسانی جدید

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

لوگوی Xbox شامل نماد X سفیدرنگ درون یک دایره، که روی پس‌زمینه سبز با گرادیان ملایم قرار گرفته و هویت بصری برند ایکس‌باکس را به‌صورت مینیمال نمایش می‌دهد.

نسل جدید ایکس‌باکس در سال ۲۰۲۷ عرضه می‌شود

15 بهمن 1404 - به‌روزشده در 16 بهمن 1404
اپراتورها قیمت بسته های اینترنت را کاهش دهند

اپراتورها قیمت بسته های اینترنت را کاهش دهند

6 بهمن 1404

داغ‌ترین‌های روز

پوستر تبلیغاتی One UI 8.5 روی پس‌زمینه بنفش با تصویر یک گوشی هوشمند.

لیست سیاه سامسونگ لو رفت؛ محرومیت میلیون‌ها کاربر از به‌روزرسانی One UI 8.5

20 بهمن 1404 - به‌روزشده در 21 بهمن 1404
سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید

سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید + جدول مشخصات

25 بهمن 1404

ایران کجای نقشه جهانی هوش مصنوعی ایستاده است؟

25 بهمن 1404
نمای استودیویی از چند درایو SSD سازمانی Micron شامل مدل‌های Micron 9650، Micron 7600 و Micron 6600 ION با فرم‌فکتور E3.S و رابط PCIe NVMe، قرارگرفته روی پس‌زمینه کاملاً مشکی. طراحی صنعتی مینیمال، بدنه فلزی مشکی مات، کانکتورهای E3.S و چینش افقی و عمودی محصولات، تمرکز تصویر را بر کاربرد دیتاسنتری و ذخیره‌سازی پرسرعت نشان می‌دهد.

اولین SSD جهان با استاندارد PCIe 6.0 رکورد سرعت ۲۸ گیگابایت را شکست

25 بهمن 1404
وقفه عملیاتی شیائومی

شیائومی ترمز به‌روزرسانی‌ها را کشید؛ آپدیت HyperOS تا ۳ مارس متوقف شد

24 بهمن 1404 - به‌روزشده در 25 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

دو جنگنده اف-۳۵ خاکستری‌رنگ در حال پرواز در ارتفاع بالا بر فراز ابرها در آرایش دوتایی کنار یکدیگر دیده می‌شوند.

وزیر دفاع هلند: جنگنده F-35 را می‌توان مانند آیفون جیلبریک کرد

27 بهمن 1404
آیا مایکل سیلور روزی بیت‌کوین را با ریپل جایگزین می‌ کند؟

آیا مایکل سیلور روزی بیت‌کوین را با ریپل جایگزین می‌ کند؟

27 بهمن 1404
پپه و دوج‌کوین

جهش قیمت پپه و دوج‌کوین؛ آیا تب میم‌کوین‌ها بازگشته است؟

27 بهمن 1404
امکان معامله رمزارزها و سهام در شبکه اجتماعی ایکس با اسمارت کشتگ در آینده‌ای نزدیک

امکان معامله رمزارزها و سهام در شبکه اجتماعی ایکس با اسمارت کشتگ در آینده‌ای نزدیک

27 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir