• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل Qwen2.5-Max علی‌بابا در بنچمارک‌ها DeepSeek-V3 را پشت‌سر گذاشت

مدل Qwen2.5-Max علی‌بابا در بنچمارک‌ها DeepSeek-V3 را پشت‌سر گذاشت

امیرحسین یونس نوشته شده توسط امیرحسین یونس
چهارشنبه 10 بهمن 1403 - 20:50
در اخبار هوش مصنوعی, فناوری
مدل Qwen2.5-Max علی‌بابا، در بنچمارک‌ها DeepSeek-V3 را پشت سر گذاشت
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل زبانی Qwen2.5-Max شرکت علی‌بابا در آزمایش‌های بنچمارک از هوش مصنوعی DeepSeek-V3 پیشی گرفته است.

به گزارش تک‌ناک، شرکت علی‌بابا با معرفی مدل هوش مصنوعی جدید خود، Qwen2.5-Max، موفق شده است تا در بنچمارک‌های مختلف از DeepSeek-V3 پیشی بگیرد. این مدل نه‌تنها عملکرد بهتری از رقیب اصلی خود داشته است؛ بلکه در برخی آزمون‌ها توانسته GPT-4o-0806 و Claude-3.5-Sonnet-1022 را نیز پشت‌سر بگذارد

نئووین می‌نویسد که هفته گذشته، اخبار فناوری تحت‌تأثیر دیپ‌سیک قرار گرفتند؛ زیرا این شرکت مدل جدید خود، R1 را معرفی کرد که بهبودهایی در پردازش پرسش‌ها ارائه می‌دهد. پیش‌از این، مدل DeepSeek-V3 که در دسامبر منتشر شده بود، عملکرد چشمگیری در بنچمارک‌ها از خود نشان داد. اکنون، علی‌بابا با معرفی Qwen2.5-Max نه‌تنها DeepSeek-V3 را پشت‌سر گذاشته، بلکه در برخی آزمایش‌ها، GPT-4o-0806 و Claude-3.5-Sonnet-1022 را نیز مغلوب کرده است.

مانند دیپ‌سیک، مدل Qwen2.5-Max نیز به مسائل سیاسی چین حساس است و به این پرسش‌ها پاسخ نمی‌دهد. در Qwen Chat، هنگام تلاش برای طرح این نوع پرسش‌ها، پیام «سقف مجاز پرسش‌ها را رد کرده‌اید» نمایش داده می‌شود؛ اما در‌صورت تغییر موضوع، پاسخ‌ها بدون محدودیت ارائه می‌شوند.

نتایج بنچمارک‌های Qwen2.5-Max

علی‌بابا برای ارزیابی این مدل، آن را با استفاده از چندین آزمون مهم با رقبا مقایسه کرده است:

  • MMLU-Pro: سنجش دانش ازطریق مسائل سطح دانشگاهی
  • LiveCodeBench: ارزیابی توانایی کدنویسی
  • LiveBench: آزمونی جامع برای بررسی قابلیت‌های عمومی
  • Arena-Hard: مدلی برای ارزیابی میزان تطابق مدل با اولویت‌های انسانی

نتایج این بنچمارک‌ها نشان می‌دهد که Qwen2.5-Max در Arena-Hard با امتیاز ۸۹/۴ در جایگاه نخست ایستاده است و DeepSeek-V3 با امتیاز ۸۵/۵ پس‌از آن قرار دارد. در MMLU-Pro، مدل Claude Sonnet با امتیاز ۷۸ برتری داشته؛ درحالی‌که Qwen2.5-Max با ۷۶.۱ در جایگاه دوم قرار گرفته است. در GPQA-Diamond، مدل Claude با ۶۵ پیشتاز است و Qwen2.5-Max با ۶۰/۱ در رتبه بعدی قرار دارد.

در آزمون LiveCodeBench، مدل Claude با امتیاز ۳۸/۹ کمی بهتر از Qwen2.5-Max با ۳۸/۷ عمل کرده است. با‌این‌حال، در LiveBench، مدل علی‌بابا با کسب امتیاز ۶۲/۲ در مقایسه با دیپ‌سیک با امتیاز ۶۰/۵، عملکرد بهتری نشان داده است.

Qwen2.5-Max اکنون از طریق API در دسترس توسعه‌دهندگان قرار گرفته

این شرکت برخی آزمون‌های دیگر را نیز اجرا کرده است؛ اما به‌دلیل ماهیت بسته مدل‌هایی مانند GPT-4o و Claude، امکان ارزیابی مستقیم آن‌ها فراهم نبوده است. Qwen2.5-Max اکنون ازطریق API در دسترس توسعه‌دهندگان قرار گرفته است تا بتوانند آن را در پلتفرم‌های خود ادغام کنند. کاربران نیز ازطریق Qwen Chat می‌توانند به این مدل دسترسی داشته باشند و از قابلیت‌هایی نظیر Artifacts و تولید تصویر و ویدئو استفاده کنند. گزینه‌ای نیز برای جست‌وجوی وب در نظر گرفته شده که به‌زودی فعال خواهد شد.

با انتشار Qwen2.5-Max، پژوهشگران شرکت‌های فناوری آمریکایی به‌احتمال زیاد تحقیقات جدید علی‌بابا را به‌دقت بررسی خواهند کرد تا راهکارهای بهینه‌تری برای توسعه مدل‌های خود بیابند.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

طرح گرافیکی مقایسه تلویزیون‌های Micro LED سامسونگ و ال‌جی با نماد صاعقه.
فناوری

سامسونگ و ال‌جی رقابت در تلویزیون‌های Micro RGB را آغاز می‌کنند

نوشته شده توسط اسما کلهر
28 آذر 1404
سرقت رمزارزی کرهٔ شمالی در سال ۲۰۲۵
امنیت سایبری

کره شمالی مسئول ۶۰ درصد سرقت‌های رمزارزی جهان در سال ۲۰۲۵

نوشته شده توسط اسما کلهر
28 آذر 1404
لوگوی رسمی OpenAI با طراحی مارپیچی در طیف رنگی سبز و فیروزه‌ای روی پس‌زمینه انتزاعی، نماد توسعه مدل‌های پیشرفته هوش مصنوعی و فناوری‌های مولد
اخبار هوش مصنوعی

با جذب سرمایه تاریخی ارزش OpenAI به ۱۰۰ میلیارد دلار می‌رسد

نوشته شده توسط تارخ ترهنده
28 آذر 1404
نمای رابط کاربری Duck.ai در DuckDuckGo با ابزار تولید تصویر هوش مصنوعی، نمایش پیش‌نمایش لوگوی DuckDuckGo به‌صورت رندر فتورئال با نماد اردک و پاپیون سبز، تمرکز بر قابلیت‌های Image Generation و حفظ حریم خصوصی
اخبار هوش مصنوعی

قابلیت تولید تصویر با هوش مصنوعی به DuckDuckGo اضافه شد

نوشته شده توسط تارخ ترهنده
28 آذر 1404
دو تصویر در کنار هم از یک کاسه میوه که در یکی دانه‌های انار و در دیگری انگور قرار دارد، برای نمایش قابلیت ویرایش هوش مصنوعی.
اخبار هوش مصنوعی

اپل مدل هوش مصنوعی UniGen 1.5 را برای تولید و ویرایش تصاویر معرفی کرد

نوشته شده توسط اسما کلهر
28 آذر 1404
خبر بعدی
سامسونگ با Now Bar و Now Brief تجربه‌ای مشابه Google Now را احیا می‌کند

سامسونگ با Now Bar و Now Brief تجربه‌ای مشابه Google Now را احیا می‌کند

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

نمای سه‌ربع جلومرسدس-AMG GT 53 تیون‌شده با رینگ‌های صورتی

نسخه صورتی‌پوش و خاص مرسدس AMG GT 53 رونمایی شد

17 آذر 1404
گوشی تاشوی سامسونگ که صفحه برنامه Link to Windows را نمایش می‌دهد.

قفل‌کردن کامپیوتر با گوشی‌های اندرویدی امکانپذیر شد

28 آذر 1404

داغ‌ترین‌های روز

پوستر تبلیغاتی ساعت Rogbid در طبیعت که قابلیت چراغ‌قوه جانبی و مسیریابی روی صفحه آن فعال است.

ساعت هوشمند راگبید Enduro با باتری ۱۱۰۰ میلی‌آمپر ساعتی عرضه شد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
نمای نزدیک از ساعت هوشمند Huawei Watch نسخه دهمین سالگرد با بدنه فلزی، تاج چرخان و صفحه نمایش دایره‌ای حاوی ویجت‌ های سلامت و زمان، تمرکز بر طراحی پریمیوم و رابط کاربری پیشرفته

هواوی نسخه دهمین سالگرد هواوی واچ را هم‌زمان با نوا ۱۵ معرفی می‌کند

26 آذر 1404
تصویر یک تولیدکننده محتوای نگران را نشان می‌دهد که مقابل مانیتور با نمودار درآمد در حال سقوط و لوگوی یوتیوب نشسته است و کاهش شدید درآمد تبلیغاتی را به‌صورت نمادین نمایش می‌دهد.

زلزله در یوتیوب فارسی؛ سقوط ۹۰ درصدی درآمد تولیدکنندگان محتوا

26 آذر 1404
شیائومی شروع به انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ کرد

شیائومی انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ HyperOS را آغاز کرد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
اگر ارزش صندوق‌های ETF ریپل (XRP) به ۱۰ میلیارد دلار برسند چه اتفاقی می‌افتد؟

اگر ارزش صندوق‌های ETF ریپل (XRP) به ۱۰ میلیارد دلار برسند چه اتفاقی می‌افتد؟

23 آذر 1404 - به‌روزشده در 24 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

طرح گرافیکی مقایسه تلویزیون‌های Micro LED سامسونگ و ال‌جی با نماد صاعقه.

سامسونگ و ال‌جی رقابت در تلویزیون‌های Micro RGB را آغاز می‌کنند

28 آذر 1404
نمای نزدیک از لنزهای دوربین و بدنه گوشی سامسونگ گلکسی S26.

سری گلکسی S26 سامسونگ بسیار دیرتر از انتظار معرفی می شود

28 آذر 1404
سرقت رمزارزی کرهٔ شمالی در سال ۲۰۲۵

کره شمالی مسئول ۶۰ درصد سرقت‌های رمزارزی جهان در سال ۲۰۲۵

28 آذر 1404
لوگوی رسمی OpenAI با طراحی مارپیچی در طیف رنگی سبز و فیروزه‌ای روی پس‌زمینه انتزاعی، نماد توسعه مدل‌های پیشرفته هوش مصنوعی و فناوری‌های مولد

با جذب سرمایه تاریخی ارزش OpenAI به ۱۰۰ میلیارد دلار می‌رسد

28 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir