• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند

مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 30 فروردین 1404 - 12:25
در اخبار هوش مصنوعی, فناوری
مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل‌های هوش مصنوعی جدید OpenAI با نام‌های o3 و o4-mini که در بسیاری از زمینه‌ها پیشرفته هستند، بیشتر از مدل‌های قدیمی‌تر این شرکت دچار «توهم» می‌شوند.

به گزارش تک‌ناک، توهمات یا «اختراع کردن اطلاعات»، یکی از چالش‌های بزرگ و پیچیده در هوش مصنوعی به حساب می‌آیند، که حتی روی بهترین سیستم‌های کنونی نیز تأثیر می‌گذارند. در گذشته، هر مدل جدید، کمی در کاهش این مشکل نسبت به مدل‌های قبلی موفق‌تر بوده است، اما این مسئله برای مدل‌های o3 و o4-mini صدق نمی‌کند.

بر اساس آزمایش‌های داخلی OpenAI، مدل‌های o3 و o4-mini که به‌ عنوان مدل‌های استدلالی شناخته می‌شوند، نسبت به مدل‌های قبلی خود نظیر o1، o1-mini و o3-mini، همچنین مدل‌های سنتی «غیر استدلالی» مانند GPT-4o، بیشتر دچار توهم می‌شوند. این مشکل به‌ویژه نگرانی‌هایی را ایجاد کرده است، چرا که OpenAI هنوز نمی‌داند چرا این مشکل افزایش یافته است.

توهم بیشتر در مدل‌های جدید OpenAI

در گزارش فنی OpenAI برای مدل‌های o3 و o4-mini آمده است که «پژوهش‌های بیشتری لازم است» تا علت افزایش توهمات در این مدل‌ها شفاف‌سازی شود. این مدل‌ها در برخی حوزه‌ها عملکرد بهتری دارند، از جمله در کارهای مربوط به برنامه‌نویسی و ریاضیات، اما به‌ دلیل «اظهار ادعاهای بیشتر»، دچار خطاهای بیشتری نیز می‌شوند.

آزمایش‌های داخلی نشان دادند که o3 به 33 درصد از سؤالات در “PersonQA”، یک معیار داخلی OpenAI برای ارزیابی دقت اطلاعات مدل در مورد افراد، پاسخ‌های نادرست می‌دهد. این میزان دو برابر میزان توهم در مدل‌های قبلی است.

تحقیقات دیگری که توسط Transluce، یک آزمایشگاه تحقیقاتی غیرانتفاعی در حوزه هوش مصنوعی انجام شد، نشان داد که o3 تمایل دارد برخی از اقدامات خود را که در فرایند رسیدن به پاسخ‌ها انجام داده است، اختراع کند. به‌ عنوان مثال، این مدل ادعا کرد که کدی را روی یک مک‌بوک پرو 2021 اجرا کرده است، در حالی که این امکان برای آن وجود ندارد.

این توهمات می‌توانند باعث شوند که مدل‌ها، ایده‌های جالبی پیدا کنند و در تفکر خود، خلاقانه عمل نمایند، اما در عین حال ممکن است آنها را برای کسب‌وکارهایی که دقت و صحت اطلاعات برای آنها اهمیت دارد، مناسب نکنند. برای مثال، یک شرکت حقوقی به طور قطع از مدلی که اشتباهات فاحش در قراردادهای مشتریان وارد می‌کند، خوشحال نخواهد شد.

یکی از روش‌های امیدوارکننده برای بهبود دقت مدل‌ها، فراهم کردن قابلیت جست‌وجوی اینترنتی برای آنها است. شرکت OpenAI در مدل GPT-4o با قابلیت جست‌وجو، توانسته است دقت 90 درصد را در آزمون SimpleQA به دست آورد. این قابلیت ممکن است بتواند به کاهش توهم‌ها در مدل‌های استدلالی نیز کمک کند.

اگر روند توسعه مدل‌های استدلالی باعث افزایش توهمات شود، یافتن راه‌حلی برای این مشکل بیش از پیش ضروری خواهد بود. شرکت OpenAI اعلام کرده که به‌ طور مستمر در حال کار روی بهبود دقت و قابلیت اطمینان مدل‌های جدید خود است.

صنعت هوش مصنوعی در سال گذشته توجه بیشتری به مدل‌های استدلالی داشته، چرا که تلاش‌ها برای بهبود مدل‌های سنتی باعث نتایج کمتری شده است. این در حالی است که استدلال می‌تواند عملکرد مدل‌ها را در انواع مختلفی از وظایف بهبود بخشد، بدون اینکه نیاز به مقادیر زیادی از داده و پردازش در طول آموزش باشد. اما به نظر می‌رسد که استدلال می‌تواند باعث افزایش توهمات شود، که خود چالشی جدید در این زمینه است.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

نمای نزدیک از صفحه گوشی هوشمند با بنر رنگی THREADS در بالای رابط کاربری و آیکون Threads در پایین، همراه با متن Threads, an Instagram app. طراحی رابط کاربری با رنگ‌های گرادینتی و پس‌زمینه گرافیکی انتزاعی نمایش داده شده است.
پیشنهاد سردبیر

آمار کاربران تردز از ایکس پیشی گرفت

نوشته شده توسط تارخ ترهنده
28 بهمن 1404
گوشی موبایلی که وب‌سایت OpenClaw را نشان می‌دهد؛ ابزاری که به عنوان دستیار هوشمند برای مدیریت ایمیل و سفر معرفی شده است.
اخبار هوش مصنوعی

شرکت OpenAI خالق نابغه OpenClaw را استخدام کرد

نوشته شده توسط اسما کلهر
28 بهمن 1404
نمای نزدیک از لوگوی برند Meta با نماد آبی و پس‌زمینه تاریک، در بالای صفحه دستگاهی که اپلیکیشن‌های Instagram، WhatsApp و Facebook با آیکون رنگی و نام‌های واضح در پایین قابل مشاهده‌اند. ساعت دیجیتال 16:35 نیز روی رابط کاربری نمایش داده شده است که نشانه محیط موبایل است.
اخبار هوش مصنوعی

متا اشتراک‌‌های پریمیوم را در اینستاگرام و واتساپ آزمایش می‌کند

نوشته شده توسط تارخ ترهنده
28 بهمن 1404
پنجره تنظیمات باتری در macOS Tahoe که اسلایدر تعیین محدودیت شارژ (Charge Limit) و گزینه شارژ بهینه باتری را نشان می‌دهد.
فناوری

اپل قابلیت محدودیت شارژ باتری را به مک می‌آورد

نوشته شده توسط اسما کلهر
28 بهمن 1404
پوستر تبلیغاتی رویداد Google I/O 2026 با شعار "Make, Build, Unlock" و آیکون‌های رنگی اندروید و کلود.
فناوری

بازی کنید تا تاریخ را فاش کنید؛ آغاز پازل مرموز کنفرانس Google I/O 2026

نوشته شده توسط اسما کلهر
28 بهمن 1404
خبر بعدی
آیا آزادسازی میم کوین ترامپ، قیمت آن را به ۹ دلار می‌رساند؟

آیا آزادسازی میم کوین ترامپ، قیمت آن را به ۹ دلار می‌رساند؟

دیدگاه‌ها 1

  1. پندارگر says:
    10 ماه پیش

    فقط این هوش مصنوعی نیست که دچار توهم میشود در این هم دیدم در پرپلکسیتی هم دیدم تقریبا بی دقتی در خواندن و فهم سؤال و در نوشتن هست ، پرپلکسیتی در مورد مصرف دارویی پرسیدم گفت می توانی هنگام بیدار شدن از خواب یا قبل از بیدار شدن از خواب مصرف کنید! یعنی خواب دارو خوردن را ببینی؟!بعد که اعتراض کردم گفت شوخی کردم ! مگر در سؤال پزشکی که حیاتی است شوخی هم داریم!

    پاسخ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

دولت آمریکا هوش مصنوعی Grok را به مشاور غذایی تبدیل کرد

دولت آمریکا هوش مصنوعی Grok را به مشاور غذایی تبدیل کرد

27 بهمن 1404
هشدار گوگل: یک میلیارد کاربر اندروید در معرض خطر امنیتی قرار دارند

هشدار گوگل: یک میلیارد کاربر اندروید در معرض خطر امنیتی قرار دارند

18 بهمن 1404

داغ‌ترین‌های روز

بهترین گوشی های کارکرده

این گوشی‌های کارکرده هنوز ارزش خرید دارند!

26 بهمن 1404 - به‌روزشده در 27 بهمن 1404
وقفه عملیاتی شیائومی

شیائومی ترمز به‌روزرسانی‌ها را کشید؛ آپدیت HyperOS تا ۳ مارس متوقف شد

24 بهمن 1404 - به‌روزشده در 25 بهمن 1404
دو جنگنده اف-۳۵ خاکستری‌رنگ در حال پرواز در ارتفاع بالا بر فراز ابرها در آرایش دوتایی کنار یکدیگر دیده می‌شوند.

وزیر دفاع هلند: جنگنده F-35 را می‌توان مانند آیفون جیلبریک کرد

27 بهمن 1404
فهرست دستگاه‌های پوکو برای اندروید ۱۷ اعلام شد

فهرست دستگاه‌های پوکو برای اندروید ۱۷ اعلام شد

27 بهمن 1404
سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید

سامسونگ قدرت عکاسی در شب گلکسی S26 اولترا را به رخ کشید + جدول مشخصات

25 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نمای نزدیک از صفحه گوشی هوشمند با بنر رنگی THREADS در بالای رابط کاربری و آیکون Threads در پایین، همراه با متن Threads, an Instagram app. طراحی رابط کاربری با رنگ‌های گرادینتی و پس‌زمینه گرافیکی انتزاعی نمایش داده شده است.

آمار کاربران تردز از ایکس پیشی گرفت

28 بهمن 1404
گوشی موبایلی که وب‌سایت OpenClaw را نشان می‌دهد؛ ابزاری که به عنوان دستیار هوشمند برای مدیریت ایمیل و سفر معرفی شده است.

شرکت OpenAI خالق نابغه OpenClaw را استخدام کرد

28 بهمن 1404
نمای نزدیک از لوگوی برند Meta با نماد آبی و پس‌زمینه تاریک، در بالای صفحه دستگاهی که اپلیکیشن‌های Instagram، WhatsApp و Facebook با آیکون رنگی و نام‌های واضح در پایین قابل مشاهده‌اند. ساعت دیجیتال 16:35 نیز روی رابط کاربری نمایش داده شده است که نشانه محیط موبایل است.

متا اشتراک‌‌های پریمیوم را در اینستاگرام و واتساپ آزمایش می‌کند

28 بهمن 1404
نمای یک میز کار با کیبورد مکانیکی و مینی پی‌سی Acemagic Retro X5 با طراحی کلاسیک شبیه به کنسول‌های قدیمی در مرکز میز.

ایس‌مجیک مینی‌پی‌سی Retro X5 را با طراحی نوستالژیک NES معرفی کرد

28 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir