• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند

مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 30 فروردین 1404 - 12:25
در اخبار هوش مصنوعی, فناوری
مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل‌های هوش مصنوعی جدید OpenAI با نام‌های o3 و o4-mini که در بسیاری از زمینه‌ها پیشرفته هستند، بیشتر از مدل‌های قدیمی‌تر این شرکت دچار «توهم» می‌شوند.

به گزارش تک‌ناک، توهمات یا «اختراع کردن اطلاعات»، یکی از چالش‌های بزرگ و پیچیده در هوش مصنوعی به حساب می‌آیند، که حتی روی بهترین سیستم‌های کنونی نیز تأثیر می‌گذارند. در گذشته، هر مدل جدید، کمی در کاهش این مشکل نسبت به مدل‌های قبلی موفق‌تر بوده است، اما این مسئله برای مدل‌های o3 و o4-mini صدق نمی‌کند.

بر اساس آزمایش‌های داخلی OpenAI، مدل‌های o3 و o4-mini که به‌ عنوان مدل‌های استدلالی شناخته می‌شوند، نسبت به مدل‌های قبلی خود نظیر o1، o1-mini و o3-mini، همچنین مدل‌های سنتی «غیر استدلالی» مانند GPT-4o، بیشتر دچار توهم می‌شوند. این مشکل به‌ویژه نگرانی‌هایی را ایجاد کرده است، چرا که OpenAI هنوز نمی‌داند چرا این مشکل افزایش یافته است.

توهم بیشتر در مدل‌های جدید OpenAI

در گزارش فنی OpenAI برای مدل‌های o3 و o4-mini آمده است که «پژوهش‌های بیشتری لازم است» تا علت افزایش توهمات در این مدل‌ها شفاف‌سازی شود. این مدل‌ها در برخی حوزه‌ها عملکرد بهتری دارند، از جمله در کارهای مربوط به برنامه‌نویسی و ریاضیات، اما به‌ دلیل «اظهار ادعاهای بیشتر»، دچار خطاهای بیشتری نیز می‌شوند.

آزمایش‌های داخلی نشان دادند که o3 به 33 درصد از سؤالات در “PersonQA”، یک معیار داخلی OpenAI برای ارزیابی دقت اطلاعات مدل در مورد افراد، پاسخ‌های نادرست می‌دهد. این میزان دو برابر میزان توهم در مدل‌های قبلی است.

تحقیقات دیگری که توسط Transluce، یک آزمایشگاه تحقیقاتی غیرانتفاعی در حوزه هوش مصنوعی انجام شد، نشان داد که o3 تمایل دارد برخی از اقدامات خود را که در فرایند رسیدن به پاسخ‌ها انجام داده است، اختراع کند. به‌ عنوان مثال، این مدل ادعا کرد که کدی را روی یک مک‌بوک پرو 2021 اجرا کرده است، در حالی که این امکان برای آن وجود ندارد.

این توهمات می‌توانند باعث شوند که مدل‌ها، ایده‌های جالبی پیدا کنند و در تفکر خود، خلاقانه عمل نمایند، اما در عین حال ممکن است آنها را برای کسب‌وکارهایی که دقت و صحت اطلاعات برای آنها اهمیت دارد، مناسب نکنند. برای مثال، یک شرکت حقوقی به طور قطع از مدلی که اشتباهات فاحش در قراردادهای مشتریان وارد می‌کند، خوشحال نخواهد شد.

یکی از روش‌های امیدوارکننده برای بهبود دقت مدل‌ها، فراهم کردن قابلیت جست‌وجوی اینترنتی برای آنها است. شرکت OpenAI در مدل GPT-4o با قابلیت جست‌وجو، توانسته است دقت 90 درصد را در آزمون SimpleQA به دست آورد. این قابلیت ممکن است بتواند به کاهش توهم‌ها در مدل‌های استدلالی نیز کمک کند.

اگر روند توسعه مدل‌های استدلالی باعث افزایش توهمات شود، یافتن راه‌حلی برای این مشکل بیش از پیش ضروری خواهد بود. شرکت OpenAI اعلام کرده که به‌ طور مستمر در حال کار روی بهبود دقت و قابلیت اطمینان مدل‌های جدید خود است.

صنعت هوش مصنوعی در سال گذشته توجه بیشتری به مدل‌های استدلالی داشته، چرا که تلاش‌ها برای بهبود مدل‌های سنتی باعث نتایج کمتری شده است. این در حالی است که استدلال می‌تواند عملکرد مدل‌ها را در انواع مختلفی از وظایف بهبود بخشد، بدون اینکه نیاز به مقادیر زیادی از داده و پردازش در طول آموزش باشد. اما به نظر می‌رسد که استدلال می‌تواند باعث افزایش توهمات شود، که خود چالشی جدید در این زمینه است.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

آمریکا با فضاپیمای Diamondback پلیس فضایی می‌ سازد
فناوری

آمریکا با فضاپیمای Diamondback پلیس فضایی می‌ سازد

نوشته شده توسط مانی
11 دی 1404
لاکهید مارتین با یک اف-۱۶ اصلاح‌شده، هوش مصنوعی را آموزش می‌ دهد
فناوری

لاکهید مارتین با یک اف-۱۶ اصلاح‌شده، هوش مصنوعی را آموزش می‌ دهد

نوشته شده توسط مانی
11 دی 1404
چین ماهواره‌های شجیان ۲۹A و ۲۹B را به فضا پرتاب کرد
پیشنهاد سردبیر

چین ماهواره‌های شجیان ۲۹A و ۲۹B را به فضا پرتاب کرد

نوشته شده توسط مانی
11 دی 1404
بوت‌های بی‌سیم مجهز به هوش مصنوعی، ریکاوری عضلات پا را متحول کردند
فناوری

بوت‌های بی‌سیم مجهز به هوش مصنوعی، ریکاوری عضلات پا را متحول کردند

نوشته شده توسط مانی
11 دی 1404
موج هوش مصنوعی و بازگشت مد ترک تحصیل در میان بنیان‌گذاران استارت‌آپی
اخبار هوش مصنوعی

موج هوش مصنوعی و بازگشت مد ترک تحصیل در میان بنیان‌گذاران استارت‌آپی

نوشته شده توسط سید محمد برازنده
11 دی 1404
خبر بعدی
آیا آزادسازی میم کوین ترامپ، قیمت آن را به ۹ دلار می‌رساند؟

آیا آزادسازی میم کوین ترامپ، قیمت آن را به ۹ دلار می‌رساند؟

دیدگاه‌ها 1

  1. پندارگر says:
    9 ماه پیش

    فقط این هوش مصنوعی نیست که دچار توهم میشود در این هم دیدم در پرپلکسیتی هم دیدم تقریبا بی دقتی در خواندن و فهم سؤال و در نوشتن هست ، پرپلکسیتی در مورد مصرف دارویی پرسیدم گفت می توانی هنگام بیدار شدن از خواب یا قبل از بیدار شدن از خواب مصرف کنید! یعنی خواب دارو خوردن را ببینی؟!بعد که اعتراض کردم گفت شوخی کردم ! مگر در سؤال پزشکی که حیاتی است شوخی هم داریم!

    پاسخ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

نمای سه‌ربع جلومرسدس-AMG GT 53 تیون‌شده با رینگ‌های صورتی

نسخه صورتی‌پوش و خاص مرسدس AMG GT 53 رونمایی شد

17 آذر 1404
بیت‌کوین (BTC)

پیش‌بینی قیمت بیت‌کوین پس از سقوط به زیر ۸۶ هزار دلار

25 آذر 1404

داغ‌ترین‌های روز

لوگوی عدد ۳ بزرگ سفید روی پس‌زمینه انتزاعی آبی و نارنجی با متن Xiaomi HyperOS.

جانی دوباره در رگ‌های محصولات قدیمی؛ آغاز انتشار HyperOS 3 شیائومی برپایه اندروید ۱۵

10 دی 1404

بهترین دوربین عکاسی ۲۰۲۵ ؛ راهنمای جامع انتخاب و خرید دوربین عکاسی

7 دی 1404
بهترین گوشی موبایل بازار ایران

بهترین گوشی‌های بازار ایران در دی‌ماه ۱۴۰۴+ راهنمای جامع خرید

7 دی 1404 - به‌روزشده در 8 دی 1404

بهترین پرامپت‌های حرفه‌ای برای ساخت لوگو با هوش مصنوعی 

7 دی 1404
نمای پشت گوشی Honor Power 2 در سه رنگ نارنجی، سفید و مشکی، با بدنه تخت، ماژول دوربین مستطیلی با سه لنز بزرگ و طراحی الهام‌گرفته از پرچم‌داران مدرن، تمرکز بر تنوع رنگ و هویت بصری محصول

این گوشی کپی برابر اصل آیفون ۱۷ پرو است

5 دی 1404 - به‌روزشده در 7 دی 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

اتریوم و سولانا مترصد ثبت سقف تاریخی جدید در صورت تصویب قانون رمزارز آمریکا

اتریوم و سولانا مترصد ثبت سقف تاریخی جدید در صورت تصویب قانون رمزارز آمریکا

11 دی 1404
دوج کوین

چالش دوج‌کوین در نزدیکی محدوده حمایت کلیدی؛ معامله‌گران به چه نکاتی توجه کنند؟

11 دی 1404
ورود ۱۰٫۸ میلیون توکن ریپل به ETFها در دو روز؛ ادامه روند ۲۹روزه جذب سرمایه

ورود ۱۰٫۸ میلیون توکن ریپل به ETFها در دو روز؛ ادامه روند ۲۹روزه جذب سرمایه

11 دی 1404
اتریوم

هشدار ویتالیک بوترین، بنیان‌گذار اتریوم درباره خطر تمرکز قدرت در رمزارزها

11 دی 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir