• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل Qwen2.5-Max علی‌بابا در بنچمارک‌ها DeepSeek-V3 را پشت‌سر گذاشت

مدل Qwen2.5-Max علی‌بابا در بنچمارک‌ها DeepSeek-V3 را پشت‌سر گذاشت

امیرحسین یونس نوشته شده توسط امیرحسین یونس
چهارشنبه 10 بهمن 1403 - 20:50
در اخبار هوش مصنوعی, فناوری
مدل Qwen2.5-Max علی‌بابا، در بنچمارک‌ها DeepSeek-V3 را پشت سر گذاشت
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل زبانی Qwen2.5-Max شرکت علی‌بابا در آزمایش‌های بنچمارک از هوش مصنوعی DeepSeek-V3 پیشی گرفته است.

به گزارش تک‌ناک، شرکت علی‌بابا با معرفی مدل هوش مصنوعی جدید خود، Qwen2.5-Max، موفق شده است تا در بنچمارک‌های مختلف از DeepSeek-V3 پیشی بگیرد. این مدل نه‌تنها عملکرد بهتری از رقیب اصلی خود داشته است؛ بلکه در برخی آزمون‌ها توانسته GPT-4o-0806 و Claude-3.5-Sonnet-1022 را نیز پشت‌سر بگذارد

نئووین می‌نویسد که هفته گذشته، اخبار فناوری تحت‌تأثیر دیپ‌سیک قرار گرفتند؛ زیرا این شرکت مدل جدید خود، R1 را معرفی کرد که بهبودهایی در پردازش پرسش‌ها ارائه می‌دهد. پیش‌از این، مدل DeepSeek-V3 که در دسامبر منتشر شده بود، عملکرد چشمگیری در بنچمارک‌ها از خود نشان داد. اکنون، علی‌بابا با معرفی Qwen2.5-Max نه‌تنها DeepSeek-V3 را پشت‌سر گذاشته، بلکه در برخی آزمایش‌ها، GPT-4o-0806 و Claude-3.5-Sonnet-1022 را نیز مغلوب کرده است.

مانند دیپ‌سیک، مدل Qwen2.5-Max نیز به مسائل سیاسی چین حساس است و به این پرسش‌ها پاسخ نمی‌دهد. در Qwen Chat، هنگام تلاش برای طرح این نوع پرسش‌ها، پیام «سقف مجاز پرسش‌ها را رد کرده‌اید» نمایش داده می‌شود؛ اما در‌صورت تغییر موضوع، پاسخ‌ها بدون محدودیت ارائه می‌شوند.

نتایج بنچمارک‌های Qwen2.5-Max

علی‌بابا برای ارزیابی این مدل، آن را با استفاده از چندین آزمون مهم با رقبا مقایسه کرده است:

  • MMLU-Pro: سنجش دانش ازطریق مسائل سطح دانشگاهی
  • LiveCodeBench: ارزیابی توانایی کدنویسی
  • LiveBench: آزمونی جامع برای بررسی قابلیت‌های عمومی
  • Arena-Hard: مدلی برای ارزیابی میزان تطابق مدل با اولویت‌های انسانی

نتایج این بنچمارک‌ها نشان می‌دهد که Qwen2.5-Max در Arena-Hard با امتیاز ۸۹/۴ در جایگاه نخست ایستاده است و DeepSeek-V3 با امتیاز ۸۵/۵ پس‌از آن قرار دارد. در MMLU-Pro، مدل Claude Sonnet با امتیاز ۷۸ برتری داشته؛ درحالی‌که Qwen2.5-Max با ۷۶.۱ در جایگاه دوم قرار گرفته است. در GPQA-Diamond، مدل Claude با ۶۵ پیشتاز است و Qwen2.5-Max با ۶۰/۱ در رتبه بعدی قرار دارد.

در آزمون LiveCodeBench، مدل Claude با امتیاز ۳۸/۹ کمی بهتر از Qwen2.5-Max با ۳۸/۷ عمل کرده است. با‌این‌حال، در LiveBench، مدل علی‌بابا با کسب امتیاز ۶۲/۲ در مقایسه با دیپ‌سیک با امتیاز ۶۰/۵، عملکرد بهتری نشان داده است.

Qwen2.5-Max اکنون از طریق API در دسترس توسعه‌دهندگان قرار گرفته

این شرکت برخی آزمون‌های دیگر را نیز اجرا کرده است؛ اما به‌دلیل ماهیت بسته مدل‌هایی مانند GPT-4o و Claude، امکان ارزیابی مستقیم آن‌ها فراهم نبوده است. Qwen2.5-Max اکنون ازطریق API در دسترس توسعه‌دهندگان قرار گرفته است تا بتوانند آن را در پلتفرم‌های خود ادغام کنند. کاربران نیز ازطریق Qwen Chat می‌توانند به این مدل دسترسی داشته باشند و از قابلیت‌هایی نظیر Artifacts و تولید تصویر و ویدئو استفاده کنند. گزینه‌ای نیز برای جست‌وجوی وب در نظر گرفته شده که به‌زودی فعال خواهد شد.

با انتشار Qwen2.5-Max، پژوهشگران شرکت‌های فناوری آمریکایی به‌احتمال زیاد تحقیقات جدید علی‌بابا را به‌دقت بررسی خواهند کرد تا راهکارهای بهینه‌تری برای توسعه مدل‌های خود بیابند.

امیرحسین یونس

امیرحسین یونس

کارشناس ارشد محیط زیست، نویسنده حوزه تکنولوژی

مطالب مرتبط

سم آلتمن (مدیرعامل OpenAI) در حال نشان دادن علامت لایک (شست رو به بالا).
اخبار هوش مصنوعی

اپلیکیشن موبایل ChatGPT به رکورد جدید ۳ میلیارد دلار هزینهٔ مصرف‌کنندگان رسید

نوشته شده توسط امیرحسین یونس
28 آذر 1404
Gemini با Nano Banana و تشخیص SynthID
اخبار هوش مصنوعی

افزایش قابلیت‌های اپلیکیشن جمنای

نوشته شده توسط اسما کلهر
27 آذر 1404
ترامپ مدیا، شرکت پشت پلتفرم رسانه اجتماعی شخصی رئیس جمهور، تروث سوشال
فناوری

ادغام عجیب شبکه اجتماعی ترامپ با شرکت انرژی گوگل

نوشته شده توسط اسما کلهر
27 آذر 1404
ایلان ماسک با کت و شلوار و چهره‌ای خندان در مرکز تصویر، در میان جمعیتی که فوکوس ندارند (احتمالا جلسه xAI).
اخبار هوش مصنوعی

برنامه ایلان ماسک برای دستیابی xAI به هوش عمومی مصنوعی تا ۲۰۲۶

نوشته شده توسط اسما کلهر
27 آذر 1404
نمای کلوزآپ از صفحه‌کلید رایانه با کلیدی حاوی پرچم کره شمالی، نماد مفهومی از تهدیدات سایبری، هک و فعالیت‌ های دیجیتال منتسب به پیونگ‌یانگ
امنیت سایبری

کره‌شمالی به سیستم مدیریت آمازون نفوذ کرد

نوشته شده توسط تارخ ترهنده
27 آذر 1404
خبر بعدی
سامسونگ با Now Bar و Now Brief تجربه‌ای مشابه Google Now را احیا می‌کند

سامسونگ با Now Bar و Now Brief تجربه‌ای مشابه Google Now را احیا می‌کند

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

کیبورد بی‌سیم Logitech Signature Slim Solar+ K980 که به صورت شناور در یک پس‌زمینه رنگارنگ و درخشان دیده می‌شود و نوار پنل خورشیدی آن مشخص است.

این کیبورد خورشیدی لاجیتک ۱۰ سال شارژ نگه می‌دارد

28 آبان 1404 - به‌روزشده در 29 آبان 1404
ایلان ماسک تاریخ جدیدی برای تحقق هوش مصنوعی عمومی اعلام کرد

ایلان ماسک تاریخ جدیدی برای تحقق هوش مصنوعی عمومی اعلام کرد

27 آذر 1404

داغ‌ترین‌های روز

نمای نزدیک از ساعت هوشمند Huawei Watch نسخه دهمین سالگرد با بدنه فلزی، تاج چرخان و صفحه نمایش دایره‌ای حاوی ویجت‌ های سلامت و زمان، تمرکز بر طراحی پریمیوم و رابط کاربری پیشرفته

هواوی نسخه دهمین سالگرد هواوی واچ را هم‌زمان با نوا ۱۵ معرفی می‌کند

26 آذر 1404
شیائومی شروع به انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ کرد

شیائومی انتشار به‌روزرسانی امنیتی دسامبر ۲۰۲۵ HyperOS را آغاز کرد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
تصویر یک تولیدکننده محتوای نگران را نشان می‌دهد که مقابل مانیتور با نمودار درآمد در حال سقوط و لوگوی یوتیوب نشسته است و کاهش شدید درآمد تبلیغاتی را به‌صورت نمادین نمایش می‌دهد.

زلزله در یوتیوب فارسی؛ سقوط ۹۰ درصدی درآمد تولیدکنندگان محتوا

26 آذر 1404
پوستر تبلیغاتی ساعت Rogbid در طبیعت که قابلیت چراغ‌قوه جانبی و مسیریابی روی صفحه آن فعال است.

ساعت هوشمند راگبید Enduro با باتری ۱۱۰۰ میلی‌آمپر ساعتی عرضه شد

24 آذر 1404 - به‌روزشده در 25 آذر 1404
اپل برای عرضه هشت آیفون جدید آماده می‌ شود

اپل برای عرضه هشت آیفون جدید آماده می‌ شود

26 آذر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

شیائومی 17 Ultra با همکاری عمیق‌تر لایکا

لنز تله‌فوتوی APO لایکا برای نخستین‌بار به صنعت موبایل می‌آید

28 آذر 1404
سم آلتمن (مدیرعامل OpenAI) در حال نشان دادن علامت لایک (شست رو به بالا).

اپلیکیشن موبایل ChatGPT به رکورد جدید ۳ میلیارد دلار هزینهٔ مصرف‌کنندگان رسید

28 آذر 1404
نیچر شاخص‌ترین تصاویر علمی سال ۲۰۲۵ را منتشر کرد؛ از اعماق فضا تا زیست‌پزشکی و بحران اقلیم.

نیچر برترین تصاویر علمی سال ۲۰۲۵ را منتشر کرد

27 آذر 1404
Gemini با Nano Banana و تشخیص SynthID

افزایش قابلیت‌های اپلیکیشن جمنای

27 آذر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir