• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل Qwen2.5-Max علی‌بابا در بنچمارک‌ها DeepSeek-V3 را پشت‌سر گذاشت

مدل Qwen2.5-Max علی‌بابا در بنچمارک‌ها DeepSeek-V3 را پشت‌سر گذاشت

امیرحسین یونس نوشته شده توسط امیرحسین یونس
چهارشنبه 10 بهمن 1403 - 20:50
در اخبار هوش مصنوعی, فناوری
مدل Qwen2.5-Max علی‌بابا، در بنچمارک‌ها DeepSeek-V3 را پشت سر گذاشت
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل زبانی Qwen2.5-Max شرکت علی‌بابا در آزمایش‌های بنچمارک از هوش مصنوعی DeepSeek-V3 پیشی گرفته است.

به گزارش تک‌ناک، شرکت علی‌بابا با معرفی مدل هوش مصنوعی جدید خود، Qwen2.5-Max، موفق شده است تا در بنچمارک‌های مختلف از DeepSeek-V3 پیشی بگیرد. این مدل نه‌تنها عملکرد بهتری از رقیب اصلی خود داشته است؛ بلکه در برخی آزمون‌ها توانسته GPT-4o-0806 و Claude-3.5-Sonnet-1022 را نیز پشت‌سر بگذارد

نئووین می‌نویسد که هفته گذشته، اخبار فناوری تحت‌تأثیر دیپ‌سیک قرار گرفتند؛ زیرا این شرکت مدل جدید خود، R1 را معرفی کرد که بهبودهایی در پردازش پرسش‌ها ارائه می‌دهد. پیش‌از این، مدل DeepSeek-V3 که در دسامبر منتشر شده بود، عملکرد چشمگیری در بنچمارک‌ها از خود نشان داد. اکنون، علی‌بابا با معرفی Qwen2.5-Max نه‌تنها DeepSeek-V3 را پشت‌سر گذاشته، بلکه در برخی آزمایش‌ها، GPT-4o-0806 و Claude-3.5-Sonnet-1022 را نیز مغلوب کرده است.

مانند دیپ‌سیک، مدل Qwen2.5-Max نیز به مسائل سیاسی چین حساس است و به این پرسش‌ها پاسخ نمی‌دهد. در Qwen Chat، هنگام تلاش برای طرح این نوع پرسش‌ها، پیام «سقف مجاز پرسش‌ها را رد کرده‌اید» نمایش داده می‌شود؛ اما در‌صورت تغییر موضوع، پاسخ‌ها بدون محدودیت ارائه می‌شوند.

نتایج بنچمارک‌های Qwen2.5-Max

علی‌بابا برای ارزیابی این مدل، آن را با استفاده از چندین آزمون مهم با رقبا مقایسه کرده است:

  • MMLU-Pro: سنجش دانش ازطریق مسائل سطح دانشگاهی
  • LiveCodeBench: ارزیابی توانایی کدنویسی
  • LiveBench: آزمونی جامع برای بررسی قابلیت‌های عمومی
  • Arena-Hard: مدلی برای ارزیابی میزان تطابق مدل با اولویت‌های انسانی

نتایج این بنچمارک‌ها نشان می‌دهد که Qwen2.5-Max در Arena-Hard با امتیاز ۸۹/۴ در جایگاه نخست ایستاده است و DeepSeek-V3 با امتیاز ۸۵/۵ پس‌از آن قرار دارد. در MMLU-Pro، مدل Claude Sonnet با امتیاز ۷۸ برتری داشته؛ درحالی‌که Qwen2.5-Max با ۷۶.۱ در جایگاه دوم قرار گرفته است. در GPQA-Diamond، مدل Claude با ۶۵ پیشتاز است و Qwen2.5-Max با ۶۰/۱ در رتبه بعدی قرار دارد.

در آزمون LiveCodeBench، مدل Claude با امتیاز ۳۸/۹ کمی بهتر از Qwen2.5-Max با ۳۸/۷ عمل کرده است. با‌این‌حال، در LiveBench، مدل علی‌بابا با کسب امتیاز ۶۲/۲ در مقایسه با دیپ‌سیک با امتیاز ۶۰/۵، عملکرد بهتری نشان داده است.

Qwen2.5-Max اکنون از طریق API در دسترس توسعه‌دهندگان قرار گرفته

این شرکت برخی آزمون‌های دیگر را نیز اجرا کرده است؛ اما به‌دلیل ماهیت بسته مدل‌هایی مانند GPT-4o و Claude، امکان ارزیابی مستقیم آن‌ها فراهم نبوده است. Qwen2.5-Max اکنون ازطریق API در دسترس توسعه‌دهندگان قرار گرفته است تا بتوانند آن را در پلتفرم‌های خود ادغام کنند. کاربران نیز ازطریق Qwen Chat می‌توانند به این مدل دسترسی داشته باشند و از قابلیت‌هایی نظیر Artifacts و تولید تصویر و ویدئو استفاده کنند. گزینه‌ای نیز برای جست‌وجوی وب در نظر گرفته شده که به‌زودی فعال خواهد شد.

با انتشار Qwen2.5-Max، پژوهشگران شرکت‌های فناوری آمریکایی به‌احتمال زیاد تحقیقات جدید علی‌بابا را به‌دقت بررسی خواهند کرد تا راهکارهای بهینه‌تری برای توسعه مدل‌های خود بیابند.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

میلیاردر چینی سرپرست اولین ماموریت سرنشین‌دار اسپیس‌ایکس به مریخ خواهد بود
فناوری

میلیاردر چینی سرپرست اولین ماموریت سرنشین‌دار اسپیس‌ایکس به مریخ خواهد بود

نوشته شده توسط مانی
5 خرداد 1405
پاپ لئو چهاردهم: هوش مصنوعی نباید شکاف قدرت در جهان را عمیق‌تر کند
اخبار هوش مصنوعی

پاپ لئو چهاردهم: هوش مصنوعی نباید شکاف قدرت در جهان را عمیق‌تر کند

نوشته شده توسط مانی
5 خرداد 1405
مدیرعامل گوگل خطاب به نسل جوان: هوش مصنوعی آینده شغل و زندگی شما را تعیین می‌ کند
اخبار هوش مصنوعی

مدیرعامل گوگل خطاب به نسل جوان: هوش مصنوعی آینده شغل و زندگی شما را تعیین می‌ کند

نوشته شده توسط مانی
5 خرداد 1405
اوربیت رباتیکس از ربات فضایی چهار دست رونمایی کرد
پیشنهاد سردبیر

اوربیت رباتیکس از ربات فضایی چهار دست رونمایی کرد + ویدیو

نوشته شده توسط نرگس چالوک
4 خرداد 1405
افشای عملکرد نرم‌افزارهای Bossware و انتقال داده‌های کارکنان به شرکت‌های ثالث
اینترنت و شبکه

افشای عملکرد نرم‌افزارهای Bossware و انتقال داده‌های کارکنان به شرکت‌های ثالث

نوشته شده توسط مانی
4 خرداد 1405
خبر بعدی
سامسونگ با Now Bar و Now Brief تجربه‌ای مشابه Google Now را احیا می‌کند

سامسونگ با Now Bar و Now Brief تجربه‌ای مشابه Google Now را احیا می‌کند

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

مرسدس-AMG از جی‌تی چهاردر برقی ۱۱۵۳ اسب‌بخاری رونمایی کرد

30 اردیبهشت 1405 - به‌روزشده در 31 اردیبهشت 1405
ظرفیت پریز برق چقدر است و چند دستگاه را می_توان به آن متصل کرد؟

ظرفیت واقعی هر پریز برق چقدر است؟

25 اردیبهشت 1405 - به‌روزشده در 26 اردیبهشت 1405

داغ‌ترین‌های روز

مایکروسافت زمان به‌روزرسانی ویندوز 11 را به کاربران سپرد

مایکروسافت زمان به‌روزرسانی ویندوز ۱۱ را به کاربران سپرد + تصویر

4 خرداد 1405 - به‌روزشده در 5 خرداد 1405
مایکروسافت فایل‌های ISO جدید ویندوز ۱۱ را منتشر کرد

مایکروسافت فایل‌های ISO جدید ویندوز ۱۱ را منتشر کرد

30 اردیبهشت 1405
هواوی «قانون تائو» را معرفی کرد؛ عصر جدید پردازنده‌ها از راه می‌ رسد

هواوی «قانون تائو» را معرفی کرد؛ عصر جدید پردازنده‌ها از راه می‌ رسد

4 خرداد 1405

 پروتکل VLESS چیست و چه کاربردهایی دارد؟

25 آذر 1402 - به‌روزشده در 27 مهر 1404
دردسرهای به‌روزرسانی One UI 8.5 سامسونگ برای کاربران

دردسرهای به‌روزرسانی One UI 8.5 سامسونگ برای کاربران

4 خرداد 1405
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

اپل عرضه نمایشگر حریم خصوصی در مک‌بوک را جلو انداخت

اپل عرضه نمایشگر حریم خصوصی در مک‌بوک را جلو انداخت

5 خرداد 1405
سه گوشی Honor در رنگ‌های آبی روشن، سفید و مشکی با ماژول دوربین بزرگ در پشت بدنه و طراحی تخت، روی پس‌زمینه سفید نمایش داده شده‌اند.

گوشی گیمینگ جدید آنر با باتری غول‌پیکر معرفی شد

5 خرداد 1405
آنر از ایرباد جدید با شارژدهی ۴۷ ساعته رونمایی کرد

آنر از ایرباد جدید با شارژدهی ۴۷ ساعته رونمایی کرد

5 خرداد 1405
هدفون سنهایزر با حذف نویز پیشرفته

سنهایزر هدفون Momentum 5 را معرفی کرد

5 خرداد 1405

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir