• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

شکاف آماری در عملکرد مدل o3 شرکت OpenAI

سید محمد برازنده نوشته شده توسط سید محمد برازنده
دوشنبه 1 اردیبهشت 1404 - 11:40
در اخبار هوش مصنوعی, فناوری
شکاف آماری در عملکرد مدل o3 شرکت OpenAI
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

گزارش‌ها حاکی از آن است که عملکرد مدل هوش مصنوعی o3 شرکت OpenAI در آزمون FrontierMath بسیار کمتر از ادعای اولیه این شرکت است.

به گزارش تک‌ناک، شرکت OpenAI با معرفی مدل هوش مصنوعی خود با نام o3 در ماه دسامبر، ادعا کرد که این مدل می‌تواند به بیش از ۲۵ درصد از پرسش‌های مجموعه FrontierMath پاسخ درست دهد؛ رقمی که رقبا را با اختلاف زیادی پشت سر می‌گذاشت، چرا که نزدیک‌ترین مدل پس از آن تنها حدود ۲ درصد از این سوالات را پاسخ داده بود.

مارک چن، مدیر ارشد تحقیقات OpenAI، در جریان یک پخش زنده گفته بود: «در حال حاضر، همه مدل‌های موجود کمتر از ۲ درصد امتیاز دارند. اما ما در محیط‌های آزمایشی داخلی و با استفاده از توان محاسباتی بالا، توانسته‌ایم با o3 به بیش از ۲۵ درصد دست یابیم.»

اما اکنون به نظر می‌رسد که این رقم، مربوط به نسخه‌ای از o3 بوده است که از توان پردازشی بالاتری نسبت به نسخه عمومی‌شده اخیر بهره می‌برد.

موسسه تحقیقاتی Epoch AI که مجموعه FrontierMath را طراحی کرده است، روز جمعه نتایج آزمایش‌های مستقل خود را منتشر کرد و نشان داد که عملکرد مدل o3 در این آزمون تنها حدود ۱۰ درصد بوده است؛ بسیار کمتر از آنچه OpenAI در ابتدا مدعی شده بود. این اختلاف، بحث‌هایی را درباره شفافیت شرکت OpenAI و روش‌های ارزیابی آن برانگیخته است.

البته این موضوع لزوماً به‌ معنای ارائه اطلاعات نادرست توسط OpenAI نیست. نتایج اولیه این شرکت شامل بازه‌ای از امتیازات بودند که رقم پایین‌تر آن با ارزیابی Epoch مطابقت دارد. خود Epoch نیز تأکید کرده که ممکن است تفاوت در نسخه سوالات و محیط آزمایش، دلیل این اختلاف باشد. به‌ عنوان نمونه، OpenAI ممکن است از نسخه‌ای خاص‌تر از سوالات FrontierMath یا از زیرساخت داخلی قدرتمندتری بهره برده باشد.

علاوه بر این، بنیاد ARC Prize که نسخه‌ای از مدل o3 را پیش از انتشار عمومی آزمایش کرده بود، اعلام کرد که مدل عمومی‌شده با آنچه مورد ارزیابی قرار گرفته، تفاوت داشته و برای کاربردهای محاوره‌ای و تجاری بهینه‌سازی شده است.

شکاف آماری در عملکرد مدل o3 شرکت OpenAI وجود دارد

وندژو، یکی از اعضای تیم فنی OpenAI نیز در یک پخش زنده اعلام کرد که نسخه منتشرشده مدل o3 برای کاربردهای واقعی و سرعت بیشتر بهینه‌سازی شده است و همین مسئله امکان دارد باعث اختلاف در نتایج معیارها شود. وی تصریح کرد: «ما مدل را برای کارآمدی بیشتر و پاسخ‌دهی سریع‌تر بهینه کرده‌ایم.»

با وجود این، نکته مهم آن است که نسخه عمومی o3 از وعده‌های اولیه شرکت پایین‌تر عمل کرده، هرچند مدل‌های o3-mini-high و o4-mini اکنون عملکرد بهتری از o3 در FrontierMath دارند و نسخه قدرتمندتری با نام o3-pro نیز در راه است.

این اتفاق یادآور آن است که نتایج معیارهای هوش مصنوعی، به‌ویژه زمانی که از سوی خود شرکت‌ها منتشر می‌شوند، باید با احتیاط مورد توجه قرار گیرند. در فضای رقابتی کنونی، شرکت‌های فعال در حوزه هوش مصنوعی به‌ طور فزاینده‌ای با چالش شفافیت در نتایج مواجه هستند.

در ماه ژانویه نیز مشخص شد که Epoch پیش از اعلام رسمی نتایج مدل o3، از OpenAI بودجه دریافت کرده است، اما این مسئله را بلافاصله افشا نکرده بود. برخی از محققانی که در توسعه FrontierMath نقش داشتند، از این همکاری بی‌خبر بودند.

در موارد دیگر نیز، شرکت‌هایی مانند xAI متعلق به ایلان ماسک و متا به‌ دلیل ارائه نمودارهای گمراه‌کننده یا استفاده از مدل‌هایی متفاوت از نسخه‌های عمومی‌شده، مورد انتقاد قرار گرفته‌اند.

سید محمد برازنده

سید محمد برازنده

مطالب مرتبط

نظریه اینترنت مرده
اخبار هوش مصنوعی

سم آلتمن: نظریه اینترنت مرده به زودی به‌حقیقت می‌پیوندد

نوشته شده توسط اسما کلهر
21 شهریور 1404
شکایت بریتانیکا و مریام-وبستر از پرپلکسیتی
اخبار هوش مصنوعی

شکایت بریتانیکا و مریام-وبستر از پرپلکسیتی به‌دلیل نقض کپی‌رایت

نوشته شده توسط امیرحسین یونس
21 شهریور 1404
آنر از فناوری تصویربرداری NoxGod برای بهبود عکاسی شبانه در سری Magic8 رونمایی کرد
فناوری

آنر فناوری تصویربرداری NoxGod را برای دوربین تله‌فوتو سری مجیک ۸ ثبت کرد

نوشته شده توسط امیرحسین یونس
21 شهریور 1404
فرار مایکروسافت از پرداخت جریمه ضدانحصاری
فناوری

مایکروسافت بازهم از پرداخت جریمه ضدانحصاری اتحادیه اروپا فرار کرد

نوشته شده توسط اسما کلهر
21 شهریور 1404
آنتروپیک قابلیت حافظه خودکار را به Claude AI افزود؛ عرضه اولیه برای کاربران سازمانی
اخبار هوش مصنوعی

هوش مصنوعی Claude چت‌های گذشته را به خاطر می‌سپارد

نوشته شده توسط امیرحسین یونس
21 شهریور 1404
خبر بعدی
قیمت بیت کوین به ۸۷,۰۰۰ دلار رسید؛ بالاترین سطح از ۲۸ مارس تاکنون

قیمت بیت کوین به 87 هزار دلار رسید؛ بالاترین سطح از 28 مارس تاکنون

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

کشف مولکولی جدید که از کلیه در برابر آسیب محافظت می کند

کشف مولکولی جدید که از کلیه در برابر آسیب محافظت می کند

13 شهریور 1404
اعلامیه ناسا: کشف واضح‌ترین نشانه حیات روی مریخ

کشف واضح‌ترین نشانه حیات روی مریخ

20 شهریور 1404

داغ‌ترین‌های روز

مایکروسافت ISO رسمی ویندوز 11 نسخه 25H2 را منتشر کرد

مایکروسافت ISO رسمی ویندوز 11 نسخه 25H2 را منتشر کرد

20 شهریور 1404 - به‌روزشده در 21 شهریور 1404
بررسی Redmi 15 4G

بررسی Redmi 15 4G ؛یکی از ارزان‌ترین گوشی های ردمی با نمایشگر 144 هرتزی

16 شهریور 1404
توقف فروش محصولات قدیمی اپل

تمام محصولاتی که اپل پس‌از رویداد معرفی آیفون ۱۷ از رده خارج کرد

20 شهریور 1404 - به‌روزشده در 21 شهریور 1404
شرکت INUI از پاوربانک Pocket Pro 10K به عنوان کوچک‌ترین پاوربانک ۱۰هزار میلی‌آمپری با قابلیت شارژ سریع ۴۵ واتی پرده‌برداری کرد. این محصول با طراحی فشرده و وزن سبک، توانایی شارژ همزمان سه دستگاه را دارد.

این کوچک‌ترین پاوربانک ۱۰ هزار میلی‌آمپرساعتی جهان است

19 شهریور 1404
جزییات جدید از تخلفات گسترده در واردات تلفن همراه

جزییات جدید از تخلفات گسترده در واردات تلفن همراه

20 شهریور 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

کاهش تولید گوشی‌های سامسونگ و اپل

تولید گوشی‌های سامسونگ و اپل در برابر برندهای چینی کاهش یافت

21 شهریور 1404
نظریه اینترنت مرده

سم آلتمن: نظریه اینترنت مرده به زودی به‌حقیقت می‌پیوندد

21 شهریور 1404
شکایت بریتانیکا و مریام-وبستر از پرپلکسیتی

شکایت بریتانیکا و مریام-وبستر از پرپلکسیتی به‌دلیل نقض کپی‌رایت

21 شهریور 1404
تعمیر آیفون ۱۷ و آیفون ایر

هزینه تعویض باتری آیفون ۱۷ و تعمیر نمایشگر آیفون ایر مشخص شد

21 شهریور 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir