• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

مدل هوش مصنوعی GPT-4.5 منتشر شد

صمد کردی نوشته شده توسط صمد کردی
جمعه 10 اسفند 1403 - 00:28
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت OpenAI مدل هوش مصنوعی جدید GPT-4.5 را با اسم رمز Orion به صورت اختصاصی برای کاربران اشتراک ChatGPT Pro منتشر کرد.

به گزارش تک‌ناک این مدل که بزرگ‌ترین نسخه تاکنون توسعه‌یافته توسط این شرکت محسوب می‌شود، با استفاده از توان پردازشی و داده‌های بیشتری نسبت به مدل‌های قبلی آموزش دیده است.

فهرست مطالب

  • مدل پیشرفته یا صرفاً نسخه‌ای بهینه‌تر؟
  • عملکرد متناقض در بنچمارک‌ها
  • تفاوت در درک نیات انسانی و توانایی‌های خلاقانه
  • آیا مدل‌های بزرگ‌تر همچنان پیشرفت می‌کنند؟

مدل پیشرفته یا صرفاً نسخه‌ای بهینه‌تر؟

با وجود افزایش مقیاس، شرکت OpenAI در مقاله‌ای اعلام کرده که GPT-4.5 را یک مدل پیشرفته در حوزه هوش مصنوعی نمی‌داند. این مدل از امروز برای مشترکان ChatGPT Pro که ماهانه ۲۰۰ دلار پرداخت می‌کنند، در دسترس قرار گرفته و کاربران پلن‌های پولی API نیز می‌توانند از آن استفاده کنند. مشتریانی که در پلن ChatGPT Plus و ChatGPT Team ثبت‌نام کرده‌اند، به گفته سخنگوی شرکت OpenAI در TechCrunch، هفته آینده به این مدل دسترسی خواهند داشت.

مدل جدید بر پایه همان روشی توسعه یافته که شرکت OpenAI در ساخت نسخه‌های قبلی به کار گرفته بودیعنی افزایش قابل‌توجه توان پردازشی و داده‌ها در مرحله پیش‌آموزش بدون نظارت. در نسل‌های قبلی، این رویکرد باعث بهبود عملکرد در زمینه‌هایی مانند ریاضیات، نگارش و کدنویسی شده بود. شرکت OpenAI تأکید دارد که افزایش مقیاس در GPT-4.5 به این مدل «دانش عمیق‌تر از جهان» و «هوش احساسی بالاتر» بخشیده است. با این حال، برخی نشانه‌ها حاکی از آن است که افزایش داده‌ها و پردازش دیگر مانند گذشته، بهبود چشمگیری ایجاد نمی‌کند.

در چندین آزمون هوش مصنوعی، GPT-4.5 عملکردی ضعیف‌تر از مدل‌های جدیدتر شرکت‌های DeepSeek و Anthropic و حتی برخی مدل‌های استدلالی خود شرکت OpenAI داشته است. از سوی دیگر، هزینه اجرای این مدل بسیار بالاست و این شرکت در حال بررسی ادامه ارائه آن در API در بلندمدت است.

در یک پست وبلاگی، شرکت OpenAI اعلام کرد:

«ما GPT-4.5 را به‌عنوان یک پیش‌نمایش پژوهشی منتشر کرده‌ایم تا درک بهتری از نقاط قوت و محدودیت‌های آن داشته باشیم. همچنان در حال بررسی توانایی‌های این مدل هستیم و مشتاقیم ببینیم کاربران چگونه از آن استفاده می‌کنند.»

عملکرد متناقض در بنچمارک‌ها

شرکت OpenAI تأکید کرده که GPT-4.5 قرار نیست جایگزین مستقیم GPT-4o باشد، مدلی که بخش عمده API و ChatGPT را تأمین می‌کند. این مدل از قابلیت‌هایی مانند آپلود فایل و تصویر و ابزار canvas پشتیبانی می‌کند، اما برخی ویژگی‌ها مانند حالت مکالمه دوطرفه واقعی را ندارد.

با این حال، در برخی از بنچمارک‌ها، GPT-4.5 عملکردی بهتر از GPT-4o و سایر مدل‌های موجود نشان داده است. در آزمون SimpleQA که دقت مدل‌ها را در پاسخ به سوالات واقعی می‌سنجد، GPT-4.5 عملکرد بهتری نسبت به GPT-4o و مدل‌های استدلالی o1 و o3-mini داشته است. به گفته شرکت OpenAI، این مدل در مقایسه با بسیاری از مدل‌های دیگر کمتر دچار خطای توهمی می‌شود، به این معنا که احتمال ارائه اطلاعات نادرست در آن کمتر است.

در برخی از بنچمارک‌ها، GPT-4.5 عملکردی بهتر از GPT-4o و سایر مدل‌های موجود نشان داده است.
SimpleQA دقت مدل‌های زبانی بزرگ (LLM) را در پاسخ به سؤالات علمی مستقیم اما چالش‌برانگیز ارزیابی می‌کند.

با این حال، عملکرد این مدل در حوزه کدنویسی متفاوت بوده است. در آزمون SWE-Bench Verified، که مدل‌ها را در حل مسائل برنامه‌نویسی ارزیابی می‌کند، عملکرد GPT-4.5 مشابه GPT-4o و o3-mini بوده اما از مدل‌های deep research شرکت OpenAI و Claude 3.7 Sonnet شرکت Anthropic ضعیف‌تر عمل کرده است. در آزمون دیگری با عنوان SWE-Lancer که توانایی مدل‌ها در توسعه ویژگی‌های نرم‌افزاری را بررسی می‌کند، GPT-4.5 بهتر از GPT-4o و o3-mini عمل کرده اما همچنان پایین‌تر از deep research قرار گرفته است.

در آزمون SWE-Bench Verified، که مدل‌ها را در حل مسائل برنامه‌نویسی ارزیابی می‌کند، عملکرد GPT-4.5 مشابه GPT-4o و o3-mini بوده اما از مدل‌های deep research شرکت OpenAI و Claude 3.7 Sonnet شرکت Anthropic ضعیف‌تر عمل کرده است.
نمودار عملکرد مدل‌های زبانی بزرگ را در ارزیابی SWE-bench نمایش می‌دهد. مدل GPT-4.5 پیش از بهینه‌سازی امتیاز ۳۵٪ و پس از بهینه‌سازی امتیاز ۳۸٪ را کسب کرده است. این نتایج بین ۲ تا ۷ درصد بالاتر از GPT-4o بوده و ۳۰ درصد پایین‌تر از سطح تحقیقاتی عمیق قرار دارد.

در آزمون‌های علمی مانند AIME و GPQA، GPT-4.5 نتوانسته به سطح مدل‌های استدلالی پیشرفته‌ای مانند o3-mini، DeepSeek’s R1 و Claude 3.7 Sonnet برسد، اما در مقایسه با مدل‌های غیر‌استدلالی عملکرد خوبی داشته است.

در آزمون‌های علمی مانند AIME و GPQA، GPT-4.5 نتوانسته به سطح مدل‌های استدلالی پیشرفته‌ای مانند o3-mini، DeepSeek’s R1 و Claude 3.7 Sonnet برسد، اما در مقایسه با مدل‌های غیر‌استدلالی عملکرد خوبی داشته است
نمودار عملکرد مدل‌های مختلف را در آزمون SWE-Lancer Diamond بر اساس معیار pass@1 مقایسه می‌کند. مدل‌های مختلف در دو سناریوی SWE-Lancer Diamond (IC SWE) و SWE-Lancer Diamond (SWE Manager) بررسی شده‌اند که در هر دو مورد، مدل deep research بهترین عملکرد را نشان داده است.

تفاوت در درک نیات انسانی و توانایی‌های خلاقانه

شرکت OpenAI ادعا می‌کند که برخی از برتری‌های GPT-4.5 را نمی‌توان به سادگی در بنچمارک‌ها اندازه‌گیری کرد. این مدل قادر است نیات انسانی را بهتر درک کند، در پاسخ‌های خود لحنی گرم‌تر و طبیعی‌تر داشته باشد و در وظایف خلاقانه مانند نگارش و طراحی بهتر عمل کند.

در یک آزمایش غیررسمی، شرکت OpenAI از GPT-4.5 و دو مدل دیگر، GPT-4o و o3-mini، خواست تا یک اسب تک‌شاخ در فرمت SVG طراحی کنند. از میان این مدل‌ها، فقط GPT-4.5 توانست تصویری قابل‌قبول از یک اسب تک‌شاخ تولید کند.

در یک آزمایش غیررسمی، شرکت OpenAI از GPT-4.5 و دو مدل دیگر، GPT-4o و o3-mini، خواست تا یک اسب تک‌شاخ در فرمت SVG طراحی کنند. از میان این مدل‌ها، فقط GPT-4.5 توانست تصویری قابل‌قبول از یک اسب تک‌شاخ تولید کند

در آزمایشی دیگر، از این مدل‌ها خواسته شد که به جمله «من پس از مردود شدن در آزمون، حال خوبی ندارم» پاسخ دهند. GPT-4o و o3-mini اطلاعات مفیدی ارائه کردند، اما پاسخ GPT-4.5 از نظر اجتماعی مناسب‌ترین و همدلانه‌ترین واکنش را داشت.

شرکت OpenAI در پست وبلاگی خود نوشت:

«ما امیدواریم از طریق این انتشار، تصویر کامل‌تری از توانایی‌های GPT-4.5 به دست آوریم، چرا که می‌دانیم بنچمارک‌های دانشگاهی همیشه نشان‌دهنده کاربرد واقعی مدل‌ها نیستند.»

هوش هیجانی GPT-4.5 در عمل

آیا مدل‌های بزرگ‌تر همچنان پیشرفت می‌کنند؟

شرکت OpenAI ادعا می‌کند که GPT-4.5 «در مرز قابلیت‌های یادگیری بدون نظارت» قرار دارد، اما محدودیت‌های این مدل به نظر می‌رسد که فرضیه ادامه‌دار بودن قوانین مقیاس‌پذیری را زیر سوال می‌برد.

Ilya Sutskever یکی از بنیان‌گذاران شرکت ، در دسامبر گذشته اظهار کرده بود که «ما به سقف داده‌ها رسیده‌ایم» و «پیش‌آموزش به شکل کنونی آن بدون شک پایان خواهد یافت». این نگرانی پیش‌تر نیز توسط سرمایه‌گذاران و پژوهشگران هوش مصنوعی مطرح شده بود.

برای عبور از این چالش، شرکت OpenAI و سایر فعالان این حوزه تمرکز خود را به مدل‌های استدلالی معطوف کرده‌اند. این مدل‌ها نسبت به مدل‌های سنتی زمان و توان پردازشی بیشتری برای حل مسائل صرف می‌کنند، اما دقت بالاتری دارند.

شرکت OpenAI قصد دارد سری GPT را با مدل‌های استدلالی o ترکیب کند و این فرایند از GPT-5 که قرار است اواخر امسال منتشر شود، آغاز خواهد شد. هرچند GPT-4.5 نتوانسته انتظارات را به طور کامل برآورده کند و گزارش شده که هزینه آموزشی بسیار بالایی داشته و چندین بار به تعویق افتاده، اما این مدل احتمالاً به‌عنوان مرحله‌ای میانی برای توسعه نسل بعدی هوش مصنوعی محسوب می‌شود.

برچسب‌ها: p6
صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

راهنمای خرید بهترین شارژر فندکی ماشین در سال ۱۴۰۴
پیشنهاد سردبیر

راهنمای خرید بهترین شارژر فندکی ماشین در سال ۱۴۰۴

نوشته شده توسط بشیری
10 شهریور 1404
راهنمای کامل تغییر فونت اینستاگرام
آموزش

راهنمای کامل تغییر فونت اینستاگرام

نوشته شده توسط فاطمه امامی
10 شهریور 1404
به‌روزرسانی جدید تلگرام با قابلیت‌های جدید منتشر شد
اپلیکیشن موبایل

به‌روزرسانی جدید تلگرام با قابلیت‌های نوآورانه منتشر شد

نوشته شده توسط صمد کردی
9 شهریور 1404 - به‌روزشده در 10 شهریور 1404
بهترین دانگل های وای فای
پیشنهاد سردبیر

بهترین دانگل های وای فای از تی پی لینک، هارمن و ایزی کست + راهنمای خرید

نوشته شده توسط مهدی کریمی صمدی
9 شهریور 1404
بهترین بازی‌های دیتادار اندروید
بازی موبایل

معرفی بهترین بازی‌های دیتادار اندروید

نوشته شده توسط علی‌رضا فاتح دلجویی
9 شهریور 1404
خبر بعدی
مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد

مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

بهترین لپ‌تاپ‌های گیمینگ اقتصادی [تابستان ۱۴۰۴]

بهترین لپ‌تاپ‌های گیمینگ اقتصادی در تابستان ۱۴۰۴

9 شهریور 1404
این واکسن جدید انتقال مالاریا را تا ۹۹.۷ درصد کاهش می‌ دهد

این واکسن جدید انتقال مالاریا را تا 99.7 درصد کاهش می‌ دهد

16 مرداد 1404

داغ‌ترین‌های روز

بهترین گوشی سامسونگ از نظر دوربین

بهترین گوشی‌های سامسونگ از نظر دوربین (تابستان ۱۴۰۴)

7 شهریور 1404 - به‌روزشده در 8 شهریور 1404
اگر ارزش بازار بیت‌کوین ۲۱ تریلیون دلاری شود، چه قیمتی در انتظار ریپل خواهد بود؟

اگر ارزش بازار بیت‌کوین ۲۱ تریلیون دلاری شود، چه قیمتی در انتظار ریپل خواهد بود؟

8 شهریور 1404
گوشی NxtPaper 60 اولترا TCL پیش‌از رونمایی در IFA معرفی شد

گوشی TCL NxtPaper 60 Ultra 5G پیش‌از رونمایی در IFA معرفی شد

8 شهریور 1404
ساعت‌‌های اتوماتیک EFK-100 کاسیو

کاسیو اولین ساعت‌‌های اتوماتیک EFK-100 را معرفی کرد

6 شهریور 1404 - به‌روزشده در 9 شهریور 1404
رونمایی گوشی‌های پرچمدار در سپتامبر

هفت پرچمدار اندرویدی ساخت شرکت‌های چینی در ماه سپتامبر معرفی می‌شوند

6 شهریور 1404 - به‌روزشده در 9 شهریور 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

راهنمای خرید بهترین شارژر فندکی ماشین در سال ۱۴۰۴

راهنمای خرید بهترین شارژر فندکی ماشین در سال ۱۴۰۴

10 شهریور 1404
راهنمای کامل تغییر فونت اینستاگرام

راهنمای کامل تغییر فونت اینستاگرام

10 شهریور 1404
به‌روزرسانی جدید تلگرام با قابلیت‌های جدید منتشر شد

به‌روزرسانی جدید تلگرام با قابلیت‌های نوآورانه منتشر شد

9 شهریور 1404 - به‌روزشده در 10 شهریور 1404
بهترین دانگل های وای فای

بهترین دانگل های وای فای از تی پی لینک، هارمن و ایزی کست + راهنمای خرید

9 شهریور 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir