• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند

مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 30 فروردین 1404 - 12:25
در اخبار هوش مصنوعی, فناوری
مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل‌های هوش مصنوعی جدید OpenAI با نام‌های o3 و o4-mini که در بسیاری از زمینه‌ها پیشرفته هستند، بیشتر از مدل‌های قدیمی‌تر این شرکت دچار «توهم» می‌شوند.

به گزارش تک‌ناک، توهمات یا «اختراع کردن اطلاعات»، یکی از چالش‌های بزرگ و پیچیده در هوش مصنوعی به حساب می‌آیند، که حتی روی بهترین سیستم‌های کنونی نیز تأثیر می‌گذارند. در گذشته، هر مدل جدید، کمی در کاهش این مشکل نسبت به مدل‌های قبلی موفق‌تر بوده است، اما این مسئله برای مدل‌های o3 و o4-mini صدق نمی‌کند.

بر اساس آزمایش‌های داخلی OpenAI، مدل‌های o3 و o4-mini که به‌ عنوان مدل‌های استدلالی شناخته می‌شوند، نسبت به مدل‌های قبلی خود نظیر o1، o1-mini و o3-mini، همچنین مدل‌های سنتی «غیر استدلالی» مانند GPT-4o، بیشتر دچار توهم می‌شوند. این مشکل به‌ویژه نگرانی‌هایی را ایجاد کرده است، چرا که OpenAI هنوز نمی‌داند چرا این مشکل افزایش یافته است.

توهم بیشتر در مدل‌های جدید OpenAI

در گزارش فنی OpenAI برای مدل‌های o3 و o4-mini آمده است که «پژوهش‌های بیشتری لازم است» تا علت افزایش توهمات در این مدل‌ها شفاف‌سازی شود. این مدل‌ها در برخی حوزه‌ها عملکرد بهتری دارند، از جمله در کارهای مربوط به برنامه‌نویسی و ریاضیات، اما به‌ دلیل «اظهار ادعاهای بیشتر»، دچار خطاهای بیشتری نیز می‌شوند.

آزمایش‌های داخلی نشان دادند که o3 به 33 درصد از سؤالات در “PersonQA”، یک معیار داخلی OpenAI برای ارزیابی دقت اطلاعات مدل در مورد افراد، پاسخ‌های نادرست می‌دهد. این میزان دو برابر میزان توهم در مدل‌های قبلی است.

تحقیقات دیگری که توسط Transluce، یک آزمایشگاه تحقیقاتی غیرانتفاعی در حوزه هوش مصنوعی انجام شد، نشان داد که o3 تمایل دارد برخی از اقدامات خود را که در فرایند رسیدن به پاسخ‌ها انجام داده است، اختراع کند. به‌ عنوان مثال، این مدل ادعا کرد که کدی را روی یک مک‌بوک پرو 2021 اجرا کرده است، در حالی که این امکان برای آن وجود ندارد.

این توهمات می‌توانند باعث شوند که مدل‌ها، ایده‌های جالبی پیدا کنند و در تفکر خود، خلاقانه عمل نمایند، اما در عین حال ممکن است آنها را برای کسب‌وکارهایی که دقت و صحت اطلاعات برای آنها اهمیت دارد، مناسب نکنند. برای مثال، یک شرکت حقوقی به طور قطع از مدلی که اشتباهات فاحش در قراردادهای مشتریان وارد می‌کند، خوشحال نخواهد شد.

یکی از روش‌های امیدوارکننده برای بهبود دقت مدل‌ها، فراهم کردن قابلیت جست‌وجوی اینترنتی برای آنها است. شرکت OpenAI در مدل GPT-4o با قابلیت جست‌وجو، توانسته است دقت 90 درصد را در آزمون SimpleQA به دست آورد. این قابلیت ممکن است بتواند به کاهش توهم‌ها در مدل‌های استدلالی نیز کمک کند.

اگر روند توسعه مدل‌های استدلالی باعث افزایش توهمات شود، یافتن راه‌حلی برای این مشکل بیش از پیش ضروری خواهد بود. شرکت OpenAI اعلام کرده که به‌ طور مستمر در حال کار روی بهبود دقت و قابلیت اطمینان مدل‌های جدید خود است.

صنعت هوش مصنوعی در سال گذشته توجه بیشتری به مدل‌های استدلالی داشته، چرا که تلاش‌ها برای بهبود مدل‌های سنتی باعث نتایج کمتری شده است. این در حالی است که استدلال می‌تواند عملکرد مدل‌ها را در انواع مختلفی از وظایف بهبود بخشد، بدون اینکه نیاز به مقادیر زیادی از داده و پردازش در طول آموزش باشد. اما به نظر می‌رسد که استدلال می‌تواند باعث افزایش توهمات شود، که خود چالشی جدید در این زمینه است.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

ساخت سیستم ناوبری الهام‌گرفته از حیوانات برای جهت یابی بدون GPS
فناوری

ساخت سیستم ناوبری الهام‌گرفته از حیوانات برای جهت یابی بدون GPS

نوشته شده توسط نرگس چالوک
25 آبان 1404
اجرای سریع، ایمن و دقیق آتش‌های کنترل‌شده با فناوری BurnBot
فناوری

اجرای سریع، ایمن و دقیق آتش‌های کنترل‌شده با فناوری BurnBot + ویدیو

نوشته شده توسط مانی
25 آبان 1404
فناوری RAIS سد جدید در برابر دیپ‌فیک و تهدیدهای جهانی جعل صوتی
اخبار هوش مصنوعی

فناوری RAIS سد جدید در برابر دیپ‌فیک و تهدیدهای جهانی جعل صوتی

نوشته شده توسط مانی
25 آبان 1404
این پچ پیری پوست را در لحظه تحلیل می‌ کند
پیشنهاد سردبیر

این پچ پیری پوست را در لحظه تحلیل می‌ کند

نوشته شده توسط نرگس چالوک
25 آبان 1404
کشف ذخیره ۱۰۰۰ تنی طلا در چین
فناوری

کشف ذخیره ۱۰۰۰ تنی طلا در چین

نوشته شده توسط نرگس چالوک
25 آبان 1404
خبر بعدی
آیا آزادسازی میم کوین ترامپ، قیمت آن را به ۹ دلار می‌رساند؟

آیا آزادسازی میم کوین ترامپ، قیمت آن را به ۹ دلار می‌رساند؟

دیدگاه‌ها 1

  1. پندارگر says:
    7 ماه پیش

    فقط این هوش مصنوعی نیست که دچار توهم میشود در این هم دیدم در پرپلکسیتی هم دیدم تقریبا بی دقتی در خواندن و فهم سؤال و در نوشتن هست ، پرپلکسیتی در مورد مصرف دارویی پرسیدم گفت می توانی هنگام بیدار شدن از خواب یا قبل از بیدار شدن از خواب مصرف کنید! یعنی خواب دارو خوردن را ببینی؟!بعد که اعتراض کردم گفت شوخی کردم ! مگر در سؤال پزشکی که حیاتی است شوخی هم داریم!

    پاسخ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

ساخت نخستین گیرنده رادیویی کوانتومی بدون نیاز به برق و آنتن

این گیرنده رادیویی کوانتومی جدید نیازی به برق و آنتن ندارد!ً

26 مهر 1404
Nuu-B40-5G-dual-screen-smartphone

Nuu B40 با دو نمایشگر عرضه شد؛ رقیب ارزان‌قیمت شیائومی ۱۷

26 مهر 1404 - به‌روزشده در 27 مهر 1404

داغ‌ترین‌های روز

نمای پشت گوشی Xiaomi با بافت چرمی سیاه و ماژول دوربین بزرگ دایره‌ای Leica، که توسط دو دست در حالت افقی نگه داشته شده است.

شیائومی انتشار نسخه پایدار HyperOS 3 را برای ۱۳ دستگاه آغاز کرد

23 آبان 1404 - به‌روزشده در 25 آبان 1404
تصویری از کارت گرافیک اکسترنال ROG XG Mobile 2025

ایسوس گرافیک اکسترنال ROG XG Mobile 2025 را عرضه کرد

23 آبان 1404 - به‌روزشده در 25 آبان 1404
پیش‌بینی قیمت ریپل (XRP) پس از راه‌اندازی صندوق ETF شرکت کنری کپیتال

پیش‌بینی قیمت ریپل (XRP) پس از راه‌اندازی صندوق ETF شرکت کنری کپیتال

21 آبان 1404
نمای جانبی گوشی هوشمند با بدنه نقره‌ای و ماژول دوربین دوگانه بزرگ و دکمه‌های کناری، که در مقابل یک دیوار گرافیتی قرار گرفته است.

گلکسی S26 اج فاش شد؛ گوشی سامسونگ از آیفون ۱۷ ایر هم نازک‌تر بود

23 آبان 1404 - به‌روزشده در 25 آبان 1404
کارشناسان: ریپل (XRP) جای طلا را در چرخه مالی بعدی می‌ گیرد

کارشناسان: ریپل (XRP) جای طلا را در چرخه مالی بعدی می‌ گیرد

22 آبان 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

ساخت سیستم ناوبری الهام‌گرفته از حیوانات برای جهت یابی بدون GPS

ساخت سیستم ناوبری الهام‌گرفته از حیوانات برای جهت یابی بدون GPS

25 آبان 1404
نظر ایلان ماسک درباره 3I/ATLAS

واکنش ایلان ماسک به گمانه‌زنی‌های جنجالی درباره دنباله‌دار 3I/ATLAS + ویدیو

25 آبان 1404
هوندا نمونه اولیه موتورسیکلت V3R 900 را با کمپرسور الکتریکی معرفی کرد

هوندا نمونه اولیه موتورسیکلت V3R 900 را با کمپرسور الکتریکی معرفی کرد

25 آبان 1404
اجرای سریع، ایمن و دقیق آتش‌های کنترل‌شده با فناوری BurnBot

اجرای سریع، ایمن و دقیق آتش‌های کنترل‌شده با فناوری BurnBot + ویدیو

25 آبان 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir