• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل هوش مصنوعی GPT-4.5 منتشر شد

مدل هوش مصنوعی GPT-4.5 منتشر شد

صمد کردی نوشته شده توسط صمد کردی
جمعه 10 اسفند 1403 - 00:28
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

فهرست مطالب

  • 1. مدل پیشرفته یا صرفاً نسخه‌ای بهینه‌تر؟
  • 2. عملکرد متناقض در بنچمارک‌ها
  • 3. تفاوت در درک نیات انسانی و توانایی‌های خلاقانه
  • 4. آیا مدل‌های بزرگ‌تر همچنان پیشرفت می‌کنند؟

شرکت OpenAI مدل هوش مصنوعی جدید GPT-4.5 را با اسم رمز Orion به صورت اختصاصی برای کاربران اشتراک ChatGPT Pro منتشر کرد.

به گزارش تک‌ناک این مدل که بزرگ‌ترین نسخه تاکنون توسعه‌یافته توسط این شرکت محسوب می‌شود، با استفاده از توان پردازشی و داده‌های بیشتری نسبت به مدل‌های قبلی آموزش دیده است.

01
از 04
مدل پیشرفته یا صرفاً نسخه‌ای بهینه‌تر؟

با وجود افزایش مقیاس، شرکت OpenAI در مقاله‌ای اعلام کرده که GPT-4.5 را یک مدل پیشرفته در حوزه هوش مصنوعی نمی‌داند. این مدل از امروز برای مشترکان ChatGPT Pro که ماهانه ۲۰۰ دلار پرداخت می‌کنند، در دسترس قرار گرفته و کاربران پلن‌های پولی API نیز می‌توانند از آن استفاده کنند. مشتریانی که در پلن ChatGPT Plus و ChatGPT Team ثبت‌نام کرده‌اند، به گفته سخنگوی شرکت OpenAI در TechCrunch، هفته آینده به این مدل دسترسی خواهند داشت.

مدل جدید بر پایه همان روشی توسعه یافته که شرکت OpenAI در ساخت نسخه‌های قبلی به کار گرفته بودیعنی افزایش قابل‌توجه توان پردازشی و داده‌ها در مرحله پیش‌آموزش بدون نظارت. در نسل‌های قبلی، این رویکرد باعث بهبود عملکرد در زمینه‌هایی مانند ریاضیات، نگارش و کدنویسی شده بود. شرکت OpenAI تأکید دارد که افزایش مقیاس در GPT-4.5 به این مدل «دانش عمیق‌تر از جهان» و «هوش احساسی بالاتر» بخشیده است. با این حال، برخی نشانه‌ها حاکی از آن است که افزایش داده‌ها و پردازش دیگر مانند گذشته، بهبود چشمگیری ایجاد نمی‌کند.

در چندین آزمون هوش مصنوعی، GPT-4.5 عملکردی ضعیف‌تر از مدل‌های جدیدتر شرکت‌های DeepSeek و Anthropic و حتی برخی مدل‌های استدلالی خود شرکت OpenAI داشته است. از سوی دیگر، هزینه اجرای این مدل بسیار بالاست و این شرکت در حال بررسی ادامه ارائه آن در API در بلندمدت است.

در یک پست وبلاگی، شرکت OpenAI اعلام کرد:

«ما GPT-4.5 را به‌عنوان یک پیش‌نمایش پژوهشی منتشر کرده‌ایم تا درک بهتری از نقاط قوت و محدودیت‌های آن داشته باشیم. همچنان در حال بررسی توانایی‌های این مدل هستیم و مشتاقیم ببینیم کاربران چگونه از آن استفاده می‌کنند.»

02
از 04
عملکرد متناقض در بنچمارک‌ها

شرکت OpenAI تأکید کرده که GPT-4.5 قرار نیست جایگزین مستقیم GPT-4o باشد، مدلی که بخش عمده API و ChatGPT را تأمین می‌کند. این مدل از قابلیت‌هایی مانند آپلود فایل و تصویر و ابزار canvas پشتیبانی می‌کند، اما برخی ویژگی‌ها مانند حالت مکالمه دوطرفه واقعی را ندارد.

با این حال، در برخی از بنچمارک‌ها، GPT-4.5 عملکردی بهتر از GPT-4o و سایر مدل‌های موجود نشان داده است. در آزمون SimpleQA که دقت مدل‌ها را در پاسخ به سوالات واقعی می‌سنجد، GPT-4.5 عملکرد بهتری نسبت به GPT-4o و مدل‌های استدلالی o1 و o3-mini داشته است. به گفته شرکت OpenAI، این مدل در مقایسه با بسیاری از مدل‌های دیگر کمتر دچار خطای توهمی می‌شود، به این معنا که احتمال ارائه اطلاعات نادرست در آن کمتر است.

در برخی از بنچمارک‌ها، GPT-4.5 عملکردی بهتر از GPT-4o و سایر مدل‌های موجود نشان داده است.
SimpleQA دقت مدل‌های زبانی بزرگ (LLM) را در پاسخ به سؤالات علمی مستقیم اما چالش‌برانگیز ارزیابی می‌کند.

با این حال، عملکرد این مدل در حوزه کدنویسی متفاوت بوده است. در آزمون SWE-Bench Verified، که مدل‌ها را در حل مسائل برنامه‌نویسی ارزیابی می‌کند، عملکرد GPT-4.5 مشابه GPT-4o و o3-mini بوده اما از مدل‌های deep research شرکت OpenAI و Claude 3.7 Sonnet شرکت Anthropic ضعیف‌تر عمل کرده است. در آزمون دیگری با عنوان SWE-Lancer که توانایی مدل‌ها در توسعه ویژگی‌های نرم‌افزاری را بررسی می‌کند، GPT-4.5 بهتر از GPT-4o و o3-mini عمل کرده اما همچنان پایین‌تر از deep research قرار گرفته است.

در آزمون SWE-Bench Verified، که مدل‌ها را در حل مسائل برنامه‌نویسی ارزیابی می‌کند، عملکرد GPT-4.5 مشابه GPT-4o و o3-mini بوده اما از مدل‌های deep research شرکت OpenAI و Claude 3.7 Sonnet شرکت Anthropic ضعیف‌تر عمل کرده است.
نمودار عملکرد مدل‌های زبانی بزرگ را در ارزیابی SWE-bench نمایش می‌دهد. مدل GPT-4.5 پیش از بهینه‌سازی امتیاز ۳۵٪ و پس از بهینه‌سازی امتیاز ۳۸٪ را کسب کرده است. این نتایج بین ۲ تا ۷ درصد بالاتر از GPT-4o بوده و ۳۰ درصد پایین‌تر از سطح تحقیقاتی عمیق قرار دارد.

در آزمون‌های علمی مانند AIME و GPQA، GPT-4.5 نتوانسته به سطح مدل‌های استدلالی پیشرفته‌ای مانند o3-mini، DeepSeek’s R1 و Claude 3.7 Sonnet برسد، اما در مقایسه با مدل‌های غیر‌استدلالی عملکرد خوبی داشته است.

در آزمون‌های علمی مانند AIME و GPQA، GPT-4.5 نتوانسته به سطح مدل‌های استدلالی پیشرفته‌ای مانند o3-mini، DeepSeek’s R1 و Claude 3.7 Sonnet برسد، اما در مقایسه با مدل‌های غیر‌استدلالی عملکرد خوبی داشته است
نمودار عملکرد مدل‌های مختلف را در آزمون SWE-Lancer Diamond بر اساس معیار pass@1 مقایسه می‌کند. مدل‌های مختلف در دو سناریوی SWE-Lancer Diamond (IC SWE) و SWE-Lancer Diamond (SWE Manager) بررسی شده‌اند که در هر دو مورد، مدل deep research بهترین عملکرد را نشان داده است.

03
از 04
تفاوت در درک نیات انسانی و توانایی‌های خلاقانه

شرکت OpenAI ادعا می‌کند که برخی از برتری‌های GPT-4.5 را نمی‌توان به سادگی در بنچمارک‌ها اندازه‌گیری کرد. این مدل قادر است نیات انسانی را بهتر درک کند، در پاسخ‌های خود لحنی گرم‌تر و طبیعی‌تر داشته باشد و در وظایف خلاقانه مانند نگارش و طراحی بهتر عمل کند.

در یک آزمایش غیررسمی، شرکت OpenAI از GPT-4.5 و دو مدل دیگر، GPT-4o و o3-mini، خواست تا یک اسب تک‌شاخ در فرمت SVG طراحی کنند. از میان این مدل‌ها، فقط GPT-4.5 توانست تصویری قابل‌قبول از یک اسب تک‌شاخ تولید کند.

در یک آزمایش غیررسمی، شرکت OpenAI از GPT-4.5 و دو مدل دیگر، GPT-4o و o3-mini، خواست تا یک اسب تک‌شاخ در فرمت SVG طراحی کنند. از میان این مدل‌ها، فقط GPT-4.5 توانست تصویری قابل‌قبول از یک اسب تک‌شاخ تولید کند

در آزمایشی دیگر، از این مدل‌ها خواسته شد که به جمله «من پس از مردود شدن در آزمون، حال خوبی ندارم» پاسخ دهند. GPT-4o و o3-mini اطلاعات مفیدی ارائه کردند، اما پاسخ GPT-4.5 از نظر اجتماعی مناسب‌ترین و همدلانه‌ترین واکنش را داشت.

شرکت OpenAI در پست وبلاگی خود نوشت:

«ما امیدواریم از طریق این انتشار، تصویر کامل‌تری از توانایی‌های GPT-4.5 به دست آوریم، چرا که می‌دانیم بنچمارک‌های دانشگاهی همیشه نشان‌دهنده کاربرد واقعی مدل‌ها نیستند.»

هوش هیجانی GPT-4.5 در عمل

04
از 04
آیا مدل‌های بزرگ‌تر همچنان پیشرفت می‌کنند؟

شرکت OpenAI ادعا می‌کند که GPT-4.5 «در مرز قابلیت‌های یادگیری بدون نظارت» قرار دارد، اما محدودیت‌های این مدل به نظر می‌رسد که فرضیه ادامه‌دار بودن قوانین مقیاس‌پذیری را زیر سوال می‌برد.

Ilya Sutskever یکی از بنیان‌گذاران شرکت ، در دسامبر گذشته اظهار کرده بود که «ما به سقف داده‌ها رسیده‌ایم» و «پیش‌آموزش به شکل کنونی آن بدون شک پایان خواهد یافت». این نگرانی پیش‌تر نیز توسط سرمایه‌گذاران و پژوهشگران هوش مصنوعی مطرح شده بود.

برای عبور از این چالش، شرکت OpenAI و سایر فعالان این حوزه تمرکز خود را به مدل‌های استدلالی معطوف کرده‌اند. این مدل‌ها نسبت به مدل‌های سنتی زمان و توان پردازشی بیشتری برای حل مسائل صرف می‌کنند، اما دقت بالاتری دارند.

شرکت OpenAI قصد دارد سری GPT را با مدل‌های استدلالی o ترکیب کند و این فرایند از GPT-5 که قرار است اواخر امسال منتشر شود، آغاز خواهد شد. هرچند GPT-4.5 نتوانسته انتظارات را به طور کامل برآورده کند و گزارش شده که هزینه آموزشی بسیار بالایی داشته و چندین بار به تعویق افتاده، اما این مدل احتمالاً به‌عنوان مرحله‌ای میانی برای توسعه نسل بعدی هوش مصنوعی محسوب می‌شود.

برچسب‌ها: p6
صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

بهترین فیلم‌های اکشن 2025
پیشنهاد سردبیر

معرفی بهترین فیلم‌های اکشن سال ۲۰۲۵

نوشته شده توسط علی‌رضا فاتح دلجویی
4 آبان 1404
Galaxy XR
پیشنهاد سردبیر

نقد و بررسی هدست واقعیت ترکیبی Galaxy XR سامسونگ

نوشته شده توسط مهدی کریمی صمدی
4 آبان 1404
فناوری 5G
اینترنت و شبکه

فناوری 5G چیست و چرا اهمیت دارد؟

نوشته شده توسط مهدی کریمی صمدی
4 آبان 1404
مقایسه A26 و A36 سامسونگ
بررسی موبایل و تبلت

مقایسه A26 و گلکسی A36 سامسونگ از تمام زوایا

نوشته شده توسط مهدی کریمی صمدی
4 آبان 1404
بهترین ساعت های هوشمند شیائومی
بررسی ساعت هوشمند

بهترین ساعت های هوشمند شیائومی در سال ۲۰۲۵

نوشته شده توسط مهدی کریمی صمدی
4 آبان 1404
خبر بعدی
مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد

مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

تبعات قطع اینترنت در کشور همسایه ایران؛ خدمات رسانی در افغانستان فلج شد

تبعات قطع اینترنت در کشور همسایه ایران؛ خدمات رسانی در افغانستان فلج شد

8 مهر 1404
Fujitsu FMV UX-K3

فوجیتسو رکورد زد؛ ساخت سبک‌ترین لپ‌تاپ جهان با وزن ۶۳۴ گرم

28 مهر 1404

داغ‌ترین‌های روز

Xiaomi 17 Pro most durable smartphone display

شیائومی بادوام‌ترین نمایشگر گوشی جهان را ساخت

30 مهر 1404 - به‌روزشده در 3 آبان 1404
شیائومی به‌روزرسانی امنیتی جدیدی را برای بیش از ۲۰ گوشی ردمی و پوکو منتشر کرد

به‌روزرسانی امنیتی جدید شیائومی برای بیش از ۲۰ گوشی ردمی و پوکو منتشر شد

29 مهر 1404
AMD-Radeon-AI-Pro-R9700

کارت گرافیک Radeon AI Pro R9700 با قیمت ۱,۲۹۹ دلار معرفی شد

2 آبان 1404 - به‌روزشده در 3 آبان 1404
جهش احتمالی قیمت ریپل (XRP)؛ نشانه‌های تکنیکال از صعودی قریب‌الوقوع خبر می‌دهند

جهش احتمالی قیمت ریپل (XRP)؛ نشانه‌های تکنیکال از صعودی قریب‌الوقوع خبر می‌دهند

3 آبان 1404
حالت کوپایلت در مرورگر اج

کوپایلت به مرورگر اج اضافه شد؛ هوش مصنوعی که به‌جای شما کار می‌کند + ویدئو

2 آبان 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

بهترین فیلم‌های اکشن 2025

معرفی بهترین فیلم‌های اکشن سال ۲۰۲۵

4 آبان 1404
Galaxy XR

نقد و بررسی هدست واقعیت ترکیبی Galaxy XR سامسونگ

4 آبان 1404
فناوری 5G

فناوری 5G چیست و چرا اهمیت دارد؟

4 آبان 1404
مقایسه A26 و A36 سامسونگ

مقایسه A26 و گلکسی A36 سامسونگ از تمام زوایا

4 آبان 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir