• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند

سید محمد برازنده نوشته شده توسط سید محمد برازنده
شنبه 30 فروردین 1404 - 12:25
در اخبار هوش مصنوعی, فناوری
مدل‌های جدید OpenAI بیشتر از قبل دچار توهم می‌شوند
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل‌های هوش مصنوعی جدید OpenAI با نام‌های o3 و o4-mini که در بسیاری از زمینه‌ها پیشرفته هستند، بیشتر از مدل‌های قدیمی‌تر این شرکت دچار «توهم» می‌شوند.

به گزارش تک‌ناک، توهمات یا «اختراع کردن اطلاعات»، یکی از چالش‌های بزرگ و پیچیده در هوش مصنوعی به حساب می‌آیند، که حتی روی بهترین سیستم‌های کنونی نیز تأثیر می‌گذارند. در گذشته، هر مدل جدید، کمی در کاهش این مشکل نسبت به مدل‌های قبلی موفق‌تر بوده است، اما این مسئله برای مدل‌های o3 و o4-mini صدق نمی‌کند.

بر اساس آزمایش‌های داخلی OpenAI، مدل‌های o3 و o4-mini که به‌ عنوان مدل‌های استدلالی شناخته می‌شوند، نسبت به مدل‌های قبلی خود نظیر o1، o1-mini و o3-mini، همچنین مدل‌های سنتی «غیر استدلالی» مانند GPT-4o، بیشتر دچار توهم می‌شوند. این مشکل به‌ویژه نگرانی‌هایی را ایجاد کرده است، چرا که OpenAI هنوز نمی‌داند چرا این مشکل افزایش یافته است.

توهم بیشتر در مدل‌های جدید OpenAI

در گزارش فنی OpenAI برای مدل‌های o3 و o4-mini آمده است که «پژوهش‌های بیشتری لازم است» تا علت افزایش توهمات در این مدل‌ها شفاف‌سازی شود. این مدل‌ها در برخی حوزه‌ها عملکرد بهتری دارند، از جمله در کارهای مربوط به برنامه‌نویسی و ریاضیات، اما به‌ دلیل «اظهار ادعاهای بیشتر»، دچار خطاهای بیشتری نیز می‌شوند.

آزمایش‌های داخلی نشان دادند که o3 به 33 درصد از سؤالات در “PersonQA”، یک معیار داخلی OpenAI برای ارزیابی دقت اطلاعات مدل در مورد افراد، پاسخ‌های نادرست می‌دهد. این میزان دو برابر میزان توهم در مدل‌های قبلی است.

تحقیقات دیگری که توسط Transluce، یک آزمایشگاه تحقیقاتی غیرانتفاعی در حوزه هوش مصنوعی انجام شد، نشان داد که o3 تمایل دارد برخی از اقدامات خود را که در فرایند رسیدن به پاسخ‌ها انجام داده است، اختراع کند. به‌ عنوان مثال، این مدل ادعا کرد که کدی را روی یک مک‌بوک پرو 2021 اجرا کرده است، در حالی که این امکان برای آن وجود ندارد.

این توهمات می‌توانند باعث شوند که مدل‌ها، ایده‌های جالبی پیدا کنند و در تفکر خود، خلاقانه عمل نمایند، اما در عین حال ممکن است آنها را برای کسب‌وکارهایی که دقت و صحت اطلاعات برای آنها اهمیت دارد، مناسب نکنند. برای مثال، یک شرکت حقوقی به طور قطع از مدلی که اشتباهات فاحش در قراردادهای مشتریان وارد می‌کند، خوشحال نخواهد شد.

یکی از روش‌های امیدوارکننده برای بهبود دقت مدل‌ها، فراهم کردن قابلیت جست‌وجوی اینترنتی برای آنها است. شرکت OpenAI در مدل GPT-4o با قابلیت جست‌وجو، توانسته است دقت 90 درصد را در آزمون SimpleQA به دست آورد. این قابلیت ممکن است بتواند به کاهش توهم‌ها در مدل‌های استدلالی نیز کمک کند.

اگر روند توسعه مدل‌های استدلالی باعث افزایش توهمات شود، یافتن راه‌حلی برای این مشکل بیش از پیش ضروری خواهد بود. شرکت OpenAI اعلام کرده که به‌ طور مستمر در حال کار روی بهبود دقت و قابلیت اطمینان مدل‌های جدید خود است.

صنعت هوش مصنوعی در سال گذشته توجه بیشتری به مدل‌های استدلالی داشته، چرا که تلاش‌ها برای بهبود مدل‌های سنتی باعث نتایج کمتری شده است. این در حالی است که استدلال می‌تواند عملکرد مدل‌ها را در انواع مختلفی از وظایف بهبود بخشد، بدون اینکه نیاز به مقادیر زیادی از داده و پردازش در طول آموزش باشد. اما به نظر می‌رسد که استدلال می‌تواند باعث افزایش توهمات شود، که خود چالشی جدید در این زمینه است.

سید محمد برازنده

سید محمد برازنده

مطالب مرتبط

مسدودسازی گسترده شبکه‌های اجتماعی در نپال به دلیل عدم ثبت رسمی
شبکه های اجتماعی

مسدودسازی گسترده شبکه‌های اجتماعی در نپال به دلیل عدم ثبت رسمی

نوشته شده توسط امیرحسین یونس
14 شهریور 1404
اسنپ‌چت لنز جدید Imagine Lens را برای ساخت تصاویر هوش مصنوعی معرفی کرد
شبکه های اجتماعی

اسنپ‌چت لنز جدید Imagine Lens را برای ساخت تصاویر هوش مصنوعی معرفی کرد

نوشته شده توسط امیرحسین یونس
14 شهریور 1404
شکایت مارک زاکربرگ از مارک زاکربرگ
اخبار هوش مصنوعی

شکایت مارک زاکربرگ از مارک زاکربرگ!

نوشته شده توسط امیرحسین یونس
14 شهریور 1404
نقشه راه موفقیت کاربران در X
شبکه های اجتماعی

توصیه مدیر محصول X برای کسب درآمد از این شبکه اجتماعی

نوشته شده توسط اسما کلهر
14 شهریور 1404
Nano Banana در اپلیکیشن جمنای
اخبار هوش مصنوعی

مدل ویرایش تصویر Nano Banana بیش از ۱۰ میلیون کاربر جدید برای اپلیکیشن جمنای به ارمغان آورد

نوشته شده توسط اسما کلهر
14 شهریور 1404
خبر بعدی
آیا آزادسازی میم کوین ترامپ، قیمت آن را به ۹ دلار می‌رساند؟

آیا آزادسازی میم کوین ترامپ، قیمت آن را به ۹ دلار می‌رساند؟

دیدگاه‌ها 1

  1. پندارگر says:
    5 ماه پیش

    فقط این هوش مصنوعی نیست که دچار توهم میشود در این هم دیدم در پرپلکسیتی هم دیدم تقریبا بی دقتی در خواندن و فهم سؤال و در نوشتن هست ، پرپلکسیتی در مورد مصرف دارویی پرسیدم گفت می توانی هنگام بیدار شدن از خواب یا قبل از بیدار شدن از خواب مصرف کنید! یعنی خواب دارو خوردن را ببینی؟!بعد که اعتراض کردم گفت شوخی کردم ! مگر در سؤال پزشکی که حیاتی است شوخی هم داریم!

    پاسخ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

قدمت منظومه شمسی چقدر است؟

قدمت منظومه شمسی چقدر است؟

9 شهریور 1404
بهترین تلویزیون‌های گیمینگ در بازار ایران (۲۰۲۵)

بهترین تلویزیون‌های گیمینگ در بازار ایران

24 مرداد 1404 - به‌روزشده در 25 مرداد 1404

داغ‌ترین‌های روز

بوئینگ از جنگنده نسل ششم نیروی دریایی آمریکا رونمایی کرد

بوئینگ از جنگنده نسل ششم نیروی دریایی آمریکا رونمایی کرد

11 شهریور 1404
پیش‌بینی قیمت ریپل در صورت تأیید تمامی درخواست‌ها برای راه‌اندازی ETFهای مبتنی‌ بر آن

پیش‌بینی قیمت ریپل در صورت تأیید تمامی درخواست‌ها برای راه‌اندازی ETFهای مبتنی‌ بر آن

12 شهریور 1404
رونمایی رسمی سامسونگ از گلکسی S25 FE؛ ترکیب طراحی باریک‌تر، باتری بزرگ‌تر و قابلیت‌های هوش مصنوعی

گلکسی S25 FE سامسونگ رونمایی شد؛ ترکیب طراحی باریک‌تر و باتری بزرگ‌تر

13 شهریور 1404
سقوط ۹۹ درصدی تعداد تراکنش‌های شبکه شیباریوم؛ ماجرا از چه قرار است؟

سقوط ۹۹ درصدی تعداد تراکنش‌های شبکه شیباریوم؛ ماجرا از چه قرار است؟

9 شهریور 1404
بهترین ساعت و مچ‌بند هوشمند بازار ایران در تابستان 1404

بهترین ساعت و مچ‌بند هوشمند بازار ایران در تابستان 1404

9 شهریور 1404 - به‌روزشده در 13 شهریور 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

شایعه کوچک‌تر شدن Dynamic Island در آیفون ۱۷ پرو

شایعه کوچک‌تر شدن داینامیک آیلند در آیفون ۱۷ پرو قوت گرفت

14 شهریور 1404
آیفون ۱۷ پرو مکس با طراحی مفهومی متفاوت و جنجالی

انتشار یک طرح مفهومی متفاوت و جنجالی از آیفون ۱۷ پرو مکس

14 شهریور 1404
مسدودسازی گسترده شبکه‌های اجتماعی در نپال به دلیل عدم ثبت رسمی

مسدودسازی گسترده شبکه‌های اجتماعی در نپال به دلیل عدم ثبت رسمی

14 شهریور 1404
ابعاد گوشی سامسونگ گلکسی S26 اولترا پیش از رونمایی فاش شد

ابعاد گوشی گلکسی S26 اولترا پیش از رونمایی فاش شد

14 شهریور 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir