• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » شرکت اوپن‌ای‌آی مدعی شد؛ GPT-5 در طیف وسیعی از مشاغل با انسان‌ برابری می‌کند

شرکت اوپن‌ای‌آی مدعی شد؛ GPT-5 در طیف وسیعی از مشاغل با انسان‌ برابری می‌کند

اسما کلهر نوشته شده توسط اسما کلهر
پنجشنبه 3 مهر 1404 - 23:35
در اخبار هوش مصنوعی, فناوری
GPT-5 stacks up to humans
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت اوپن‌ای‌آی با معرفی معیار جدیدی به نام GDPval برای سنجش عملکرد اقتصادی هوش مصنوعی اعلام کرد که مدل GPT-5 در ۴۰٫۶ درصد از وظایف شغلی تخصصی، عملکردی هم‌سطح یا بهتر از متخصصان انسانی داشته است.

به گزارش تک‌ناک، شرکت OpenAI اخیراً معیار تازه‌ای با نام GDPval معرفی کرده که توانایی مدل‌های هوش مصنوعی را در مقایسه با متخصصان انسانی در مشاغل مختلف می‌سنجد. هدف این آزمون، بررسی میزان پیشرفت سیستم‌های OpenAI در انجام کارهای اقتصادی ارزشمند و حرکت به سوی تحقق هوش عمومی مصنوعی (AGI) است.

به گفته OpenAI، نتایج اولیه نشان می‌دهد مدل GPT-5 و رقیب آن، Claude Opus 4.1 از شرکت Anthropic، در بسیاری از وظایف به سطح کاری نزدیک به متخصصان صنعت رسیده‌اند.

با این حال، OpenAI تأکید می‌کند که این دستاورد به معنای جایگزینی فوری انسان‌ها با مدل‌های هوش مصنوعی نیست. آزمون GDPval در نسخه نخست خود تنها بخشی از وظایف شغلی را پوشش می‌دهد و محدود به تولید و ارزیابی گزارش‌هاست. این معیار بر پایه ۹ صنعت اصلی آمریکا از جمله بهداشت، مالی، تولید و بخش دولتی طراحی شده و عملکرد مدل‌ها را در ۴۴ شغل مختلف از پرستاری و روزنامه‌نگاری گرفته تا مهندسی نرم‌افزار بررسی می‌کند.

به نقل از تک‌کرانچ، در این آزمایش، گزارش‌های تولیدشده توسط مدل‌ها در برابر گزارش‌های حرفه‌ای قرار گرفت و کارشناسان مأمور شدند بهترین نمونه را انتخاب کنند. برای مثال، در یک مورد از بانکداران سرمایه‌گذاری خواسته شد تحلیلی درباره بازار «تحویل آخرین مایل» ارائه دهند و سپس این گزارش با خروجی مدل‌ها مقایسه شد. نتایج نشان داد نسخه قدرتمندتر GPT-5-high در ۴۰.۶ درصد موارد هم‌سطح یا بهتر از متخصصان ارزیابی شده است. در همین حال، Claude Opus 4.1 در ۴۹ درصد وظایف چنین جایگاهی به دست آورد؛ هرچند OpenAI این امتیاز بالا را تا حدی ناشی از ارائه نمودارها و گرافیک‌های جذاب می‌داند.

GPT-5 stacks up to humans

دکتر آرون چاترجی، اقتصاددان ارشد OpenAI، می‌گوید این نتایج نشان می‌دهد متخصصان می‌توانند بخشی از وظایف خود را به مدل‌ها بسپارند و زمان بیشتری را صرف کارهای ارزش‌آفرین‌تر کنند. او تأکید می‌کند که پیشرفت سریع این مدل‌ها، فرصت تازه‌ای برای افزایش بهره‌وری در بسیاری از مشاغل ایجاد کرده است.

از سوی دیگر، تجال پاتواردان، مدیر ارزیابی OpenAI، به سرعت رشد این مدل‌ها اشاره می‌کند. به گفته او، مدل GPT-4o که تنها ۱۵ ماه پیش عرضه شده بود، در آزمون مشابه تنها ۱۳.۷ درصد امتیاز به دست آورد؛ اما اکنون GPT-5 نزدیک به سه برابر بهتر عمل کرده است.

در حال حاضر، صنعت هوش مصنوعی از معیارهای مختلفی برای سنجش توانایی مدل‌ها استفاده می‌کند؛ از جمله AIME 2025 (آزمون ریاضیات پیشرفته) و GPQA Diamond (سؤالات علمی در سطح دکتری). با این حال، بسیاری از این آزمون‌ها به نقطه اشباع نزدیک شده‌اند و پژوهشگران معتقدند معیارهای تازه‌ای مانند GDPval که بر وظایف واقعی تمرکز دارند، اهمیت بیشتری پیدا خواهند کرد.

OpenAI معتقد است که پیشرفت در GDPval می‌تواند نشان دهد مدل‌های هوش مصنوعی نه‌تنها در آزمایش‌های تئوری بلکه در کاربردهای عملی نیز جایگاه ارزشمندی برای صنایع مختلف خواهند داشت؛ هرچند برای اثبات برتری کامل آن‌ها بر انسان، به نسخه‌های جامع‌تر و دقیق‌تر از این آزمون نیاز خواهد بود.

اسما کلهر

اسما کلهر

دانش آموخته مترجمی زبان انگلیسی ،نویسنده حوزه تکنولوژی

مطالب مرتبط

دستگاه پایش قند خون Isaac در کنار پایه شارژ و اپلیکیشن موبایل مربوطه که نمودار سطح گلوکز را نشان می‌دهد.
فناوری

پایش قند خون با بازدم؛ کلید ورود فناوری «گلوکومتر» به اپل‌واچ

نوشته شده توسط اسما کلهر
18 دی 1404
یک توالت فرنگی مجهز به سنسور هوشمند پایش سلامت نصب شده بر روی لبه کاسه.
فناوری

مرز میان نبوغ و دیوانگی؛ نگاهی به عجیب‌ترین و جنجالی‌ترین گجت‌های نمایشگاه CES 2026

نوشته شده توسط اسما کلهر
18 دی 1404
نمای نزدیک از داخل یک حلقه هوشمند سامسونگ (Galaxy Ring) که دچار تورم باتری و تغییر شکل بدنه شده است.
فناوری

پایان تحقیقات سامسونگ در پرونده جنجالی گلکسی رینگ؛ نقص فنی در بدنه، نه انفجار باتری!

نوشته شده توسط اسما کلهر
18 دی 1404
نمای رابط کاربری Gmail با قابلیت AI Overview که جستجوی زبان طبیعی در صندوق ورودی را نمایش می‌دهد؛ پرسش متنی درباره دریافت قیمت بازسازی حمام در نوار جستجو وارد شده و خلاصه هوشمند شامل تعداد پیشنهادها، نام شرکت‌ها، شماره پیش‌فاکتور، مبالغ دلاری و تاریخ ارسال ایمیل‌ها به‌صورت ساختاریافته نمایش داده شده است.
اخبار هوش مصنوعی

جیمیل با تمرکز گسترده بر هوش مصنوعی جمنای بازطراحی می‌شود

نوشته شده توسط تارخ ترهنده
18 دی 1404
آیکون پازل رنگی گوگل پلی روی صفحه نمایش یک گوشی هوشمند.
فناوری

نقشه راه گوگل برای سال ۲۰۲۶؛ انتشار جزئیات به‌روزرسانی بزرگ سیستم گوگل در ژانویه

نوشته شده توسط امیرحسین یونس
18 دی 1404
خبر بعدی
OpenAI ChatGPT Pulse

از اخبار ورزشی تا برنامه سفر؛ امکانات متنوع ChatGPT Pulse معرفی شد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

چگونه از ChatGPT پاسخ های دقیق بگیریم؟

چگونه از ChatGPT پاسخ های دقیق بگیریم؟

25 آذر 1404
پژوهشگران با یک حفاری رکوردشکن در گسل زلزلهٔ ۲۰۱۱ توهوکو کشف کردند که وجود لایه‌ای ضخیم از رس نرم و لغزنده در کف گودال ژاپن باعث افزایش لغزش کم‌عمق صفحات زمین‌ساختی شده و قدرت بی‌سابقهٔ زلزله و سونامی ویرانگر پس از آن را توضیح می‌دهد.

حل معمای زلزله و سونامی ۲۰۱۱ ژاپن پس از ۱۳ سال

3 دی 1404

داغ‌ترین‌های روز

نمای نزدیک از پنل پشتی یک گوشی هوشمند خاکستری رنگ (احتمالاً سری شیائومی ۱۲) که ماژول دوربین سه‌گانه و عبارت 50MP روی آن دیده می‌شود.

این ۶ دستگاه شیائومی از دریافت به‌روزرسانی‌ها سال ۲۰۲۶ محروم خواهند شد

13 دی 1404 - به‌روزشده در 14 دی 1404
سریع ترین گوشی های بازار

سریع‌ترین گوشی‌های بازار ایران + مقایسه عملکرد CPU و GPU

14 دی 1404 - به‌روزشده در 15 دی 1404
خودنمایی HP با لپ‌تاپ‌های گیمینگ جدید در CES 2026

خودنمایی HP با لپ‌تاپ‌های گیمینگ جدید در CES 2026 + تصاویر

17 دی 1404 - به‌روزشده در 18 دی 1404

سرقت ۱.۲ میلیون دلاری با ابزار فعالسازی ویندوز

17 دی 1404
مایکرون نخستین SSD نسل پنجم دنیا را معرفی کرد

مایکرون نخستین SSD نسل پنجم دنیا را معرفی کرد

17 دی 1404 - به‌روزشده در 18 دی 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

عینک هوشمند IXI با فریم مشکی و پل نیمه‌شفاف که اجزای داخلی و مدارهای الکترونیکی آن قابل مشاهده است.

این عینک هوشمند نمره چشمتان را تغییر می‌دهد

18 دی 1404
نمای پانوراما از خط افق شهر شانگهای چین در هنگام غروب با ساختمان‌های بلند و بزرگراه‌های پرنور زیر لایه‌ای از مه.

هر جعبه‌ ۱۰۰ تایی حافظه DDR5 به قیمت ملک در شانگهای رسید

18 دی 1404
دستگاه پایش قند خون Isaac در کنار پایه شارژ و اپلیکیشن موبایل مربوطه که نمودار سطح گلوکز را نشان می‌دهد.

پایش قند خون با بازدم؛ کلید ورود فناوری «گلوکومتر» به اپل‌واچ

18 دی 1404
مقایسه رابط کاربری و ویجت‌های یک آی‌پد در کنار یک آیفون که نشان‌دهنده شباهت‌های نرم‌افزاری احتمالی برای آیفون تاشو است.

آیفون فولد یا آیپد جیبی؟؛ افشاگری‌های جدید از استراتژی متفاوت اپل در بازار گوشی‌های تاشو

18 دی 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir