• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

شکاف آماری در عملکرد مدل o3 شرکت OpenAI

سید محمد برازنده نوشته شده توسط سید محمد برازنده
دوشنبه 1 اردیبهشت 1404 - 11:40
در اخبار هوش مصنوعی, فناوری
شکاف آماری در عملکرد مدل o3 شرکت OpenAI
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

گزارش‌ها حاکی از آن است که عملکرد مدل هوش مصنوعی o3 شرکت OpenAI در آزمون FrontierMath بسیار کمتر از ادعای اولیه این شرکت است.

به گزارش تک‌ناک، شرکت OpenAI با معرفی مدل هوش مصنوعی خود با نام o3 در ماه دسامبر، ادعا کرد که این مدل می‌تواند به بیش از ۲۵ درصد از پرسش‌های مجموعه FrontierMath پاسخ درست دهد؛ رقمی که رقبا را با اختلاف زیادی پشت سر می‌گذاشت، چرا که نزدیک‌ترین مدل پس از آن تنها حدود ۲ درصد از این سوالات را پاسخ داده بود.

مارک چن، مدیر ارشد تحقیقات OpenAI، در جریان یک پخش زنده گفته بود: «در حال حاضر، همه مدل‌های موجود کمتر از ۲ درصد امتیاز دارند. اما ما در محیط‌های آزمایشی داخلی و با استفاده از توان محاسباتی بالا، توانسته‌ایم با o3 به بیش از ۲۵ درصد دست یابیم.»

اما اکنون به نظر می‌رسد که این رقم، مربوط به نسخه‌ای از o3 بوده است که از توان پردازشی بالاتری نسبت به نسخه عمومی‌شده اخیر بهره می‌برد.

موسسه تحقیقاتی Epoch AI که مجموعه FrontierMath را طراحی کرده است، روز جمعه نتایج آزمایش‌های مستقل خود را منتشر کرد و نشان داد که عملکرد مدل o3 در این آزمون تنها حدود ۱۰ درصد بوده است؛ بسیار کمتر از آنچه OpenAI در ابتدا مدعی شده بود. این اختلاف، بحث‌هایی را درباره شفافیت شرکت OpenAI و روش‌های ارزیابی آن برانگیخته است.

البته این موضوع لزوماً به‌ معنای ارائه اطلاعات نادرست توسط OpenAI نیست. نتایج اولیه این شرکت شامل بازه‌ای از امتیازات بودند که رقم پایین‌تر آن با ارزیابی Epoch مطابقت دارد. خود Epoch نیز تأکید کرده که ممکن است تفاوت در نسخه سوالات و محیط آزمایش، دلیل این اختلاف باشد. به‌ عنوان نمونه، OpenAI ممکن است از نسخه‌ای خاص‌تر از سوالات FrontierMath یا از زیرساخت داخلی قدرتمندتری بهره برده باشد.

علاوه بر این، بنیاد ARC Prize که نسخه‌ای از مدل o3 را پیش از انتشار عمومی آزمایش کرده بود، اعلام کرد که مدل عمومی‌شده با آنچه مورد ارزیابی قرار گرفته، تفاوت داشته و برای کاربردهای محاوره‌ای و تجاری بهینه‌سازی شده است.

شکاف آماری در عملکرد مدل o3 شرکت OpenAI وجود دارد

وندژو، یکی از اعضای تیم فنی OpenAI نیز در یک پخش زنده اعلام کرد که نسخه منتشرشده مدل o3 برای کاربردهای واقعی و سرعت بیشتر بهینه‌سازی شده است و همین مسئله امکان دارد باعث اختلاف در نتایج معیارها شود. وی تصریح کرد: «ما مدل را برای کارآمدی بیشتر و پاسخ‌دهی سریع‌تر بهینه کرده‌ایم.»

با وجود این، نکته مهم آن است که نسخه عمومی o3 از وعده‌های اولیه شرکت پایین‌تر عمل کرده، هرچند مدل‌های o3-mini-high و o4-mini اکنون عملکرد بهتری از o3 در FrontierMath دارند و نسخه قدرتمندتری با نام o3-pro نیز در راه است.

این اتفاق یادآور آن است که نتایج معیارهای هوش مصنوعی، به‌ویژه زمانی که از سوی خود شرکت‌ها منتشر می‌شوند، باید با احتیاط مورد توجه قرار گیرند. در فضای رقابتی کنونی، شرکت‌های فعال در حوزه هوش مصنوعی به‌ طور فزاینده‌ای با چالش شفافیت در نتایج مواجه هستند.

در ماه ژانویه نیز مشخص شد که Epoch پیش از اعلام رسمی نتایج مدل o3، از OpenAI بودجه دریافت کرده است، اما این مسئله را بلافاصله افشا نکرده بود. برخی از محققانی که در توسعه FrontierMath نقش داشتند، از این همکاری بی‌خبر بودند.

در موارد دیگر نیز، شرکت‌هایی مانند xAI متعلق به ایلان ماسک و متا به‌ دلیل ارائه نمودارهای گمراه‌کننده یا استفاده از مدل‌هایی متفاوت از نسخه‌های عمومی‌شده، مورد انتقاد قرار گرفته‌اند.

سید محمد برازنده

سید محمد برازنده

مطالب مرتبط

رونمایی از ربات انسان‌نمای کمرباریک Q5 با مهارت‌هایی شبیه انسان
رباتیک

رونمایی از ربات انسان‌نمای کمرباریک Q5 با مهارت‌هایی شبیه انسان

نوشته شده توسط نرگس چالوک
10 تیر 1404
هاب اینترنتی پرنده راهکاری برای بازیابی ارتباط در بلایای طبیعی و مناطق دورافتاده
اینترنت و شبکه

هاب اینترنتی پرنده راهکاری برای بازیابی ارتباط در بلایای طبیعی و مناطق دورافتاده

نوشته شده توسط نرگس چالوک
10 تیر 1404
گوگل راهنمای جامع استفاده از هوش مصنوعی در برنامه‌نویسی را برای مهندسان نرم‌افزار منتشر کرد
اخبار هوش مصنوعی

گوگل راهنمای جامع استفاده از هوش مصنوعی در برنامه‌نویسی را برای مهندسان نرم‌افزار منتشر کرد

نوشته شده توسط سید محمد برازنده
10 تیر 1404
تشکیل گروه آزمایشگاه‌های ابرهوش متا به رهبری الکساندر وانگ
اخبار هوش مصنوعی

تشکیل گروه آزمایشگاه‌های ابرهوش متا به رهبری الکساندر وانگ

نوشته شده توسط سید محمد برازنده
10 تیر 1404
استارلینک اسپیس‌ایکس، سریع‌ترین اینترنت پروازی جهان در سال ۲۰۲۵
اینترنت و شبکه

استارلینک اسپیس‌ایکس، سریع‌ترین اینترنت پروازی جهان در سال ۲۰۲۵

نوشته شده توسط سید محمد برازنده
10 تیر 1404
خبر بعدی
قیمت بیت کوین به ۸۷,۰۰۰ دلار رسید؛ بالاترین سطح از ۲۸ مارس تاکنون

قیمت بیت کوین به 87 هزار دلار رسید؛ بالاترین سطح از 28 مارس تاکنون

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

khordad1404 khordad1404 khordad1404

پیشنهادی

ر آزمایش‌ های انسانی

نتایج امیدوارکننده داروی جدید اگزما در آزمایش‌ های انسانی

5 تیر 1404
تنگه هرمز

اهمیت تنگه هرمز در اقتصاد جهانی چیست؟

1 تیر 1404

داغ‌ترین‌های روز

جنگنده‌های مدرن چین ؛ گزینه‌ بالقوه نوسازی ناوگان هوایی ایران

جنگنده‌های مدرن چین ؛ گزینه‌ بالقوه نوسازی ناوگان هوایی ایران

4 تیر 1404
نسخه ویژه شیائومی ۱۵ اولترا

نسخه ویژه شیائومی ۱۵ اولترا؛ وقتی گوشی هوشمند شبیه دوربین کلاسیک می‌شود

5 تیر 1404
آیا قیمت ریپل به ۱۰ دلار خواهد رسید؟

آیا قیمت ریپل به 10 دلار خواهد رسید؟

9 تیر 1404
پیش‌بینی قیمت ریپل؛ آماده‌سازی گاوها برای جهش نهایی در سال ۲۰۲۵

پیش‌بینی قیمت ریپل؛ آماده‌سازی گاوها برای جهش نهایی در سال 2025

8 تیر 1404
گوشی شیائومی میکس فلیپ ۲

شیائومی میکس فلیپ 2 با پردازنده اسنپدراگون 8 الیت و لولای بادوام معرفی شد

5 تیر 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

رشد سریع نقدینگی جهانی (M2) چه معنایی برای بیت‌کوین و بازار رمزارزها دارد؟

رشد سریع نقدینگی جهانی (M2) چه معنایی برای بیت‌کوین و بازار رمزارزها دارد؟

10 تیر 1404
درمان ماشین گرفتگی در خودروهای برقی به روش دانشمندان ژاپنی

درمان ماشین گرفتگی در خودروهای برقی به روش دانشمندان ژاپنی

10 تیر 1404
رونمایی از ربات انسان‌نمای کمرباریک Q5 با مهارت‌هایی شبیه انسان

رونمایی از ربات انسان‌نمای کمرباریک Q5 با مهارت‌هایی شبیه انسان

10 تیر 1404
رونمایی ایسوس، گیگابایت، ام‌اس‌آی و زوتک از کارت های گرافیک سفارشی GeForce RTX 5050

رونمایی ایسوس، گیگابایت، ام‌اس‌آی و زوتک از کارت های گرافیک سفارشی GeForce RTX 5050

10 تیر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir