• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
تک ناک فناوری اخبار هوش مصنوعی

مدل هوش مصنوعی GPT-4.5 منتشر شد

صمد کردی نوشته شده توسط صمد کردی
جمعه 10 اسفند 1403 - 00:28
در اخبار هوش مصنوعی, پیشنهاد سردبیر, فناوری
مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت OpenAI مدل هوش مصنوعی جدید GPT-4.5 را با اسم رمز Orion به صورت اختصاصی برای کاربران اشتراک ChatGPT Pro منتشر کرد.

به گزارش تک‌ناک این مدل که بزرگ‌ترین نسخه تاکنون توسعه‌یافته توسط این شرکت محسوب می‌شود، با استفاده از توان پردازشی و داده‌های بیشتری نسبت به مدل‌های قبلی آموزش دیده است.

فهرست مطالب

  • مدل پیشرفته یا صرفاً نسخه‌ای بهینه‌تر؟
  • عملکرد متناقض در بنچمارک‌ها
  • تفاوت در درک نیات انسانی و توانایی‌های خلاقانه
  • آیا مدل‌های بزرگ‌تر همچنان پیشرفت می‌کنند؟

مدل پیشرفته یا صرفاً نسخه‌ای بهینه‌تر؟

با وجود افزایش مقیاس، شرکت OpenAI در مقاله‌ای اعلام کرده که GPT-4.5 را یک مدل پیشرفته در حوزه هوش مصنوعی نمی‌داند. این مدل از امروز برای مشترکان ChatGPT Pro که ماهانه ۲۰۰ دلار پرداخت می‌کنند، در دسترس قرار گرفته و کاربران پلن‌های پولی API نیز می‌توانند از آن استفاده کنند. مشتریانی که در پلن ChatGPT Plus و ChatGPT Team ثبت‌نام کرده‌اند، به گفته سخنگوی شرکت OpenAI در TechCrunch، هفته آینده به این مدل دسترسی خواهند داشت.

مدل جدید بر پایه همان روشی توسعه یافته که شرکت OpenAI در ساخت نسخه‌های قبلی به کار گرفته بودیعنی افزایش قابل‌توجه توان پردازشی و داده‌ها در مرحله پیش‌آموزش بدون نظارت. در نسل‌های قبلی، این رویکرد باعث بهبود عملکرد در زمینه‌هایی مانند ریاضیات، نگارش و کدنویسی شده بود. شرکت OpenAI تأکید دارد که افزایش مقیاس در GPT-4.5 به این مدل «دانش عمیق‌تر از جهان» و «هوش احساسی بالاتر» بخشیده است. با این حال، برخی نشانه‌ها حاکی از آن است که افزایش داده‌ها و پردازش دیگر مانند گذشته، بهبود چشمگیری ایجاد نمی‌کند.

در چندین آزمون هوش مصنوعی، GPT-4.5 عملکردی ضعیف‌تر از مدل‌های جدیدتر شرکت‌های DeepSeek و Anthropic و حتی برخی مدل‌های استدلالی خود شرکت OpenAI داشته است. از سوی دیگر، هزینه اجرای این مدل بسیار بالاست و این شرکت در حال بررسی ادامه ارائه آن در API در بلندمدت است.

در یک پست وبلاگی، شرکت OpenAI اعلام کرد:

«ما GPT-4.5 را به‌عنوان یک پیش‌نمایش پژوهشی منتشر کرده‌ایم تا درک بهتری از نقاط قوت و محدودیت‌های آن داشته باشیم. همچنان در حال بررسی توانایی‌های این مدل هستیم و مشتاقیم ببینیم کاربران چگونه از آن استفاده می‌کنند.»

عملکرد متناقض در بنچمارک‌ها

شرکت OpenAI تأکید کرده که GPT-4.5 قرار نیست جایگزین مستقیم GPT-4o باشد، مدلی که بخش عمده API و ChatGPT را تأمین می‌کند. این مدل از قابلیت‌هایی مانند آپلود فایل و تصویر و ابزار canvas پشتیبانی می‌کند، اما برخی ویژگی‌ها مانند حالت مکالمه دوطرفه واقعی را ندارد.

با این حال، در برخی از بنچمارک‌ها، GPT-4.5 عملکردی بهتر از GPT-4o و سایر مدل‌های موجود نشان داده است. در آزمون SimpleQA که دقت مدل‌ها را در پاسخ به سوالات واقعی می‌سنجد، GPT-4.5 عملکرد بهتری نسبت به GPT-4o و مدل‌های استدلالی o1 و o3-mini داشته است. به گفته شرکت OpenAI، این مدل در مقایسه با بسیاری از مدل‌های دیگر کمتر دچار خطای توهمی می‌شود، به این معنا که احتمال ارائه اطلاعات نادرست در آن کمتر است.

در برخی از بنچمارک‌ها، GPT-4.5 عملکردی بهتر از GPT-4o و سایر مدل‌های موجود نشان داده است.
SimpleQA دقت مدل‌های زبانی بزرگ (LLM) را در پاسخ به سؤالات علمی مستقیم اما چالش‌برانگیز ارزیابی می‌کند.

با این حال، عملکرد این مدل در حوزه کدنویسی متفاوت بوده است. در آزمون SWE-Bench Verified، که مدل‌ها را در حل مسائل برنامه‌نویسی ارزیابی می‌کند، عملکرد GPT-4.5 مشابه GPT-4o و o3-mini بوده اما از مدل‌های deep research شرکت OpenAI و Claude 3.7 Sonnet شرکت Anthropic ضعیف‌تر عمل کرده است. در آزمون دیگری با عنوان SWE-Lancer که توانایی مدل‌ها در توسعه ویژگی‌های نرم‌افزاری را بررسی می‌کند، GPT-4.5 بهتر از GPT-4o و o3-mini عمل کرده اما همچنان پایین‌تر از deep research قرار گرفته است.

در آزمون SWE-Bench Verified، که مدل‌ها را در حل مسائل برنامه‌نویسی ارزیابی می‌کند، عملکرد GPT-4.5 مشابه GPT-4o و o3-mini بوده اما از مدل‌های deep research شرکت OpenAI و Claude 3.7 Sonnet شرکت Anthropic ضعیف‌تر عمل کرده است.
نمودار عملکرد مدل‌های زبانی بزرگ را در ارزیابی SWE-bench نمایش می‌دهد. مدل GPT-4.5 پیش از بهینه‌سازی امتیاز ۳۵٪ و پس از بهینه‌سازی امتیاز ۳۸٪ را کسب کرده است. این نتایج بین ۲ تا ۷ درصد بالاتر از GPT-4o بوده و ۳۰ درصد پایین‌تر از سطح تحقیقاتی عمیق قرار دارد.

در آزمون‌های علمی مانند AIME و GPQA، GPT-4.5 نتوانسته به سطح مدل‌های استدلالی پیشرفته‌ای مانند o3-mini، DeepSeek’s R1 و Claude 3.7 Sonnet برسد، اما در مقایسه با مدل‌های غیر‌استدلالی عملکرد خوبی داشته است.

در آزمون‌های علمی مانند AIME و GPQA، GPT-4.5 نتوانسته به سطح مدل‌های استدلالی پیشرفته‌ای مانند o3-mini، DeepSeek’s R1 و Claude 3.7 Sonnet برسد، اما در مقایسه با مدل‌های غیر‌استدلالی عملکرد خوبی داشته است
نمودار عملکرد مدل‌های مختلف را در آزمون SWE-Lancer Diamond بر اساس معیار pass@1 مقایسه می‌کند. مدل‌های مختلف در دو سناریوی SWE-Lancer Diamond (IC SWE) و SWE-Lancer Diamond (SWE Manager) بررسی شده‌اند که در هر دو مورد، مدل deep research بهترین عملکرد را نشان داده است.

تفاوت در درک نیات انسانی و توانایی‌های خلاقانه

شرکت OpenAI ادعا می‌کند که برخی از برتری‌های GPT-4.5 را نمی‌توان به سادگی در بنچمارک‌ها اندازه‌گیری کرد. این مدل قادر است نیات انسانی را بهتر درک کند، در پاسخ‌های خود لحنی گرم‌تر و طبیعی‌تر داشته باشد و در وظایف خلاقانه مانند نگارش و طراحی بهتر عمل کند.

در یک آزمایش غیررسمی، شرکت OpenAI از GPT-4.5 و دو مدل دیگر، GPT-4o و o3-mini، خواست تا یک اسب تک‌شاخ در فرمت SVG طراحی کنند. از میان این مدل‌ها، فقط GPT-4.5 توانست تصویری قابل‌قبول از یک اسب تک‌شاخ تولید کند.

در یک آزمایش غیررسمی، شرکت OpenAI از GPT-4.5 و دو مدل دیگر، GPT-4o و o3-mini، خواست تا یک اسب تک‌شاخ در فرمت SVG طراحی کنند. از میان این مدل‌ها، فقط GPT-4.5 توانست تصویری قابل‌قبول از یک اسب تک‌شاخ تولید کند

در آزمایشی دیگر، از این مدل‌ها خواسته شد که به جمله «من پس از مردود شدن در آزمون، حال خوبی ندارم» پاسخ دهند. GPT-4o و o3-mini اطلاعات مفیدی ارائه کردند، اما پاسخ GPT-4.5 از نظر اجتماعی مناسب‌ترین و همدلانه‌ترین واکنش را داشت.

شرکت OpenAI در پست وبلاگی خود نوشت:

«ما امیدواریم از طریق این انتشار، تصویر کامل‌تری از توانایی‌های GPT-4.5 به دست آوریم، چرا که می‌دانیم بنچمارک‌های دانشگاهی همیشه نشان‌دهنده کاربرد واقعی مدل‌ها نیستند.»

هوش هیجانی GPT-4.5 در عمل

آیا مدل‌های بزرگ‌تر همچنان پیشرفت می‌کنند؟

شرکت OpenAI ادعا می‌کند که GPT-4.5 «در مرز قابلیت‌های یادگیری بدون نظارت» قرار دارد، اما محدودیت‌های این مدل به نظر می‌رسد که فرضیه ادامه‌دار بودن قوانین مقیاس‌پذیری را زیر سوال می‌برد.

Ilya Sutskever یکی از بنیان‌گذاران شرکت ، در دسامبر گذشته اظهار کرده بود که «ما به سقف داده‌ها رسیده‌ایم» و «پیش‌آموزش به شکل کنونی آن بدون شک پایان خواهد یافت». این نگرانی پیش‌تر نیز توسط سرمایه‌گذاران و پژوهشگران هوش مصنوعی مطرح شده بود.

برای عبور از این چالش، شرکت OpenAI و سایر فعالان این حوزه تمرکز خود را به مدل‌های استدلالی معطوف کرده‌اند. این مدل‌ها نسبت به مدل‌های سنتی زمان و توان پردازشی بیشتری برای حل مسائل صرف می‌کنند، اما دقت بالاتری دارند.

شرکت OpenAI قصد دارد سری GPT را با مدل‌های استدلالی o ترکیب کند و این فرایند از GPT-5 که قرار است اواخر امسال منتشر شود، آغاز خواهد شد. هرچند GPT-4.5 نتوانسته انتظارات را به طور کامل برآورده کند و گزارش شده که هزینه آموزشی بسیار بالایی داشته و چندین بار به تعویق افتاده، اما این مدل احتمالاً به‌عنوان مرحله‌ای میانی برای توسعه نسل بعدی هوش مصنوعی محسوب می‌شود.

برچسب‌ها: p6
صمد کردی

صمد کردی

دانش آموخته عمران،عکاس خبری سابق، علاقه‌مند به کامپیوتر

مطالب مرتبط

بزرگترین شبکه جهانی استریم غیرقانونی ورزش تعطیل شد
پیشنهاد سردبیر

بزرگترین شبکه جهانی استریم غیرقانونی ورزش تعطیل شد

نوشته شده توسط امیرحسین یونس
12 شهریور 1404
درخواست عجیب برای مدیرعاملی OpenAI
اخبار هوش مصنوعی

درخواست جوان اهل ترکیه برای مدیرعاملی OpenAI؛ پاسخ شرکت جالب بود

نوشته شده توسط اسما کلهر
12 شهریور 1404
با این ساعت گارمین نیازی به حمل گوشی ندارید؛ ارتباط ماهواره‌ای و LTE
پیشنهاد سردبیر

با این ساعت گارمین به حمل گوشی نیازی ندارید

نوشته شده توسط اسما کلهر
12 شهریور 1404 - به‌روزشده در 13 شهریور 1404
آیفون ۱۷ پرو و پرو مکس
پیشنهاد سردبیر

مشخصات فنی آیفون 17 پرو و پرو مکس فاش شد

نوشته شده توسط امیرحسین یونس
12 شهریور 1404
Ooni از فر هوشمند Volt V2 با فناوری "هوش پیتزا" رونمایی کرد
فناوری

Ooni فر هوشمند Volt V2 را با فناوری Pizza Intelligence رونمایی کرد

نوشته شده توسط امیرحسین یونس
12 شهریور 1404
خبر بعدی
مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد

مایکروسافت اپلیکیشن Copilot را برای macOS منتشر کرد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

احتمال از دست دادن ناگهانی بینایی با آمپول‌های لاغری

احتمال از دست دادن ناگهانی بینایی با آمپول‌های لاغری

22 مرداد 1404
بهترین گوشی های سامسونگ

بهترین گوشی های سامسونگ در تابستان ۱۴۰۴؛ از اقتصادی تا پرچمدارهای تاشو

17 مرداد 1404 - به‌روزشده در 18 مرداد 1404

داغ‌ترین‌های روز

بهترین گوشی سامسونگ از نظر دوربین

بهترین گوشی‌های سامسونگ از نظر دوربین (تابستان ۱۴۰۴)

7 شهریور 1404 - به‌روزشده در 8 شهریور 1404
پوکو C85 معرفی شد؛ تراشه هلیوG81 اولترا و باتری ۶۰۰۰ میلی‌آمپر ساعتی

معرفی پوکو C85 با تراشه هلیو G81 اولترا و باتری 6,000 میلی‌آمپرساعتی

10 شهریور 1404
رونمایی گوشی‌های پرچمدار در سپتامبر

هفت پرچمدار اندرویدی ساخت شرکت‌های چینی در ماه سپتامبر معرفی می‌شوند

6 شهریور 1404 - به‌روزشده در 9 شهریور 1404
بوئینگ از جنگنده نسل ششم نیروی دریایی آمریکا رونمایی کرد

بوئینگ از جنگنده نسل ششم نیروی دریایی آمریکا رونمایی کرد

11 شهریور 1404
بهترین ساعت و مچ‌بند هوشمند بازار ایران در تابستان 1404

بهترین ساعت و مچ‌بند هوشمند بازار ایران در تابستان 1404

9 شهریور 1404 - به‌روزشده در 10 شهریور 1404
تک ناک - اخبار تکنولوژی روز جهان و ایران

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

این دفترچه یادداشت دیجیتالی از کتابچه جیبی کوچک‌تر است

این دفترچه یادداشت دیجیتالی از کتابچه جیبی کوچک‌تر است

12 شهریور 1404
بزرگترین شبکه جهانی استریم غیرقانونی ورزش تعطیل شد

بزرگترین شبکه جهانی استریم غیرقانونی ورزش تعطیل شد

12 شهریور 1404
ایسر از اولین لپ‌تاپ با پردازنده پنتر اینتل و بزرگترین ترک‌پد جهان رونمایی کرد

ایسر از اولین لپ‌تاپ با پردازنده پنتر اینتل و بزرگترین ترک‌پد جهان رونمایی کرد

12 شهریور 1404
بعد از ۱۵ سال و ۳۹۶ آپدیت اپلیکیشن اینستاگرام برای آیپد منتشر شد

بعد از ۱۵ سال و ۳۹۶ آپدیت اپلیکیشن اینستاگرام برای آیپد منتشر شد

12 شهریور 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

technoc-instagram
No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir