• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » مدل هوش مصنوعی OpenThinker-32B از DeepSeek پیشی گرفت

مدل هوش مصنوعی OpenThinker-32B از DeepSeek پیشی گرفت

نرگس چالوک نوشته شده توسط نرگس چالوک
سه شنبه 30 بهمن 1403 - 14:35
در اخبار هوش مصنوعی, فناوری
مدل هوش مصنوعی OpenThinker-32B از DeepSeek پیشی گرفت
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

مدل هوش مصنوعی OpenThinker-32B تنها با استفاده از ۱۴ درصد از داده‌هایی که رقیب چینی‌ آن DeepSeek نیاز داشت، به نتایجی فراتر از حد انتظار در بنچمارک‌ها دست یافت.

به گزارش تک‌ناک، یک تیم بین‌المللی از پژوهشگران دانشگاهی و متخصصان فناوری، مدل جدیدی را معرفی کرده‌ که توانسته است عملکردی هم‌سطح و در برخی موارد برتر از DeepSeek یکی از پیشرفته‌ترین سیستم‌های هوش مصنوعی چین ارائه دهد.

مدل OpenThinker-32B که توسط کنسرسیوم Open Thoughts توسعه یافته است، در بنچمارک MATH500 دقت ۹۰.۶ درصد را به ثبت رساند و از امتیاز ۸۹.۴ درصدی DeepSeek پیشی گرفت. همچنین در بنچمارک GPQA-Diamond، که به سنجش مهارت‌های حل مسئله عمومی می‌پردازد، امتیاز ۶۱.۶ را به دست آورد، در حالی‌ که DeepSeek امتیاز ۵۷.۶ را ثبت کرده بود. این مدل در بنچمارک LCBv2 نیز امتیاز ۶۸.۹ را به خود اختصاص داد، که نشان‌دهنده عملکرد قوی آن در سناریوهای آزمایشی متنوع است.

به بیان دیگر، OpenThinker-32B در دانش علمی عمومی عملکرد بهتری نسبت به نسخه‌ای هم‌اندازه از DeepSeek R1 داشت. همچنین توانست در MATH500 از DeepSeek پیشی بگیرد، اما در بنچمارک AIME، که سطح مهارت‌های ریاضی را ارزیابی می‌کند، جایگاه پایین‌تری به دست آورد.

در حوزه کدنویسی، این مدل اندکی ضعیف‌تر از DeepSeek عمل کرد و امتیاز ۶۸.۹ را در برابر ۷۱.۲ به ثبت رساند. هرچند، با توجه به اینکه OpenThinker-32B یک مدل متن‌باز است، انتظار می‌رود که این نتایج با بهینه‌سازی آن توسط جامعه توسعه‌دهندگان، بهبود یابد.

پیشی گرفتن مدل هوش مصنوعی OpenThinker-32B از DeepSeek

ویژگی برجسته این مدل، کارایی بالای آن است. در حالی‌ که DeepSeek برای آموزش خود از ۸۰۰,۰۰۰ نمونه استفاده کرده، OpenThinker تنها به ۱۱۴,۰۰۰ نمونه آموزشی نیاز داشته است.

مجموعه داده OpenThoughts-114k شامل متادیتای دقیق هر مسئله، از جمله پاسخ‌های صحیح، موارد آزمایشی برای مسائل کدنویسی، کد اولیه در صورت نیاز و اطلاعات تخصصی مربوطه است.

فریم‌ورک Curator برای اطمینان از صحت کدهای تولیدشده، راه‌حل‌های کدنویسی را با مجموعه‌ای از موارد آزمایشی تطبیق داد، در حالی‌ که یک داور هوش مصنوعی صحت پاسخ‌های ریاضی را بررسی کرد.

این مدل روی چهار نود مجهز به هشت GPU از نوع H100 آموزش داده شد و کل این فرایند حدود ۹۰ ساعت زمان برد. علاوه بر این، یک مجموعه داده دیگر شامل ۱۳۷,۰۰۰ نمونه تأییدنشده نیز روی ابررایانه Leonardo ایتالیا آموزش داده شد و این فرایند در عرض ۳۰ ساعت، ۱۱,۵۲۰ ساعت GPU از نوع A100 را مصرف کرد.

پژوهشگران این پروژه در اسناد خود اشاره کردند که تأیید صحت داده‌ها به حفظ کیفیت، در عین افزایش تنوع و مقیاس مجموعه داده‌های آموزشی، کمک می‌کند. همچنین تحقیقات نشان داد که حتی نسخه‌های تأییدنشده نیز عملکرد مطلوبی داشتند، اگرچه به سطح مدل تأییدشده نرسیدند.

هوش مصنوعی OpenThinker-32B بر پایه مدل Qwen2.5-32B-Instruct شرکت علی‌بابا توسعه یافته و دارای یک پنجره متنی ۱۶,۰۰۰ توکنی است، که برای حل اثبات‌های ریاضی پیچیده و مسائل طولانی کدنویسی کافی می‌باشد، هرچند در مقایسه با استانداردهای امروزی کمتر به حساب می‌آید.

انتشار این مدل هم‌زمان با تشدید رقابت در زمینه توانایی‌های استدلالی هوش مصنوعی انجام شده است. شرکت OpenAI در ۱۲ فوریه اعلام کرد که تمامی مدل‌های آن پس از GPT-5 از قابلیت‌های استدلالی برخوردار خواهند بود. تنها یک روز بعد، ایلان ماسک از مدل Grok-3 شرکت xAI تمجید و آن را بهترین مدل استدلالی تاکنون معرفی کرد. چند ساعت پیش نیز، Nous Research مدل استدلالی DeepHermes را منتشر کرد، که بر پایه Llama 3.1 شرکت متا توسعه یافته است.

این حوزه پس از آنکه DeepSeek توانست با هزینه‌ای به‌مراتب کمتر، عملکردی در سطح OpenAI o1 ارائه دهد، شتاب بیشتری گرفت. DeepSeek R1 به‌ صورت رایگان قابل دانلود، استفاده و اصلاح است و روش‌های آموزشی آن نیز منتشر شده‌اند.

با وجود این‌، برخلاف Open Thoughts که همه داده‌های خود را به‌ صورت متن‌باز منتشر کرده است، تیم توسعه DeepSeek داده‌های آموزشی خود را خصوصی نگه داشته است.

این تفاوت کلیدی باعث می‌شود که توسعه‌دهندگان بتوانند درک و بازتولید نتایج OpenThinker را آسان‌تر از DeepSeek انجام دهند، چراکه تمامی اجزای مورد نیاز در دسترس هستند.

انتشار این مدل برای جامعه گسترده‌تر هوش مصنوعی، بار دیگر نشان می‌دهد که می‌توان بدون نیاز به مجموعه داده‌های انحصاری و عظیم، مدل‌هایی رقابتی توسعه داد. همچنین این مدل ممکن است برای توسعه‌دهندگان غربی که همچنان نسبت به استفاده از یک مدل چینی —حتی متن‌باز— تردید دارند، گزینه‌ای مطمئن‌تر محسوب شود.

مدل OpenThinker برای دانلود در HuggingFace در دسترس می‌باشد. علاوه بر نسخه اصلی، یک مدل کوچک‌تر با ۷ میلیارد پارامتر نیز برای دستگاه‌های ضعیف‌تر ارائه شده است.

تیم Open Thoughts شامل پژوهشگرانی از دانشگاه‌های آمریکایی مانند: استنفورد، برکلی و UCLA، به همراه مرکز ابررایانش Juelich آلمان است. علاوه بر این، مؤسسه تحقیقات تویوتا در ایالات متحده و دیگر فعالان حوزه هوش مصنوعی در اتحادیه اروپا نیز از این پروژه حمایت کرده‌اند.

نرگس چالوک

نرگس چالوک

به‌عنوان مترجم وب‌سایت خبری در حوزه فناوری فعالیت می‌کنم و تجربه‌ی خوبی در زمینه‌ی سئو، تولید و انتشار محتوا، نگارش و ویرایش مقالات و گزارش‌های خبری دارم.علاوه بر این، مدرس زبان انگلیسی هستم و سال‌هاست به کودکان و بزرگسالان در محیط‌های حضوری و آنلاین آموزش می‌دهم. همیشه تلاش کرده‌ام شیوه‌های آموزشی متنوع و مؤثر را به‌کار بگیرم و با صبر و انگیزه، یادگیری زبان را برای زبان‌آموزان آسان‌تر کنم.

مطالب مرتبط

ساعت لگویی؛ شاهکار مکانیکی که زمان را از ثانیه تا سال‌های کهکشانی می‌ سنجد
فناوری

ساعت لگویی زمان را از ثانیه تا سال‌های کهکشانی می‌ سنجد + ویدیو

نوشته شده توسط مانی
13 بهمن 1404
آزمایش موشک جدید استارشیپ به اواسط مارس موکول شد
فناوری

آزمایش موشک جدید استارشیپ به اواسط مارس موکول شد

نوشته شده توسط نرگس چالوک
13 بهمن 1404
نمونهٔ آزمایشگاهی یک ربات پرندهٔ هم‌اندازهٔ حشره که با بال‌های نازک و سامانهٔ الکترونیکی سبک، حرکت و تعادل را شبیه‌سازی می‌کند.
فناوری

الهام از زنبورها برای ساخت تراشه‌ ناوبری ربات‌های هم‌اندازه حشرات

نوشته شده توسط نرگس چالوک
12 بهمن 1404
ظهور شبکه اجتماعی مولت‌بوک که برای عامل‌های هوش مصنوعی طراحی شده است
اخبار هوش مصنوعی

ظهور شبکه اجتماعی مولت‌بوک که برای عامل‌های هوش مصنوعی طراحی شده است

نوشته شده توسط سید محمد برازنده
12 بهمن 1404
نمای نزدیک از لحیم‌کاری یک قطعه الکترونیکی که تصویر آن به‌صورت زنده روی صفحه‌ی تلفن هوشمند کنار میز کار نمایش داده می‌شود.
پیشنهاد سردبیر

هویه‌ هوشمند مجهز به دوربین، تجربه‌ لحیم‌کاری را متحول می‌کند

نوشته شده توسط نرگس چالوک
12 بهمن 1404
خبر بعدی
۶/۱۴ درصد از مردم ایران اصلاً از اینترنت استفاده نمی‌کنند

۶/۱۴ درصد از مردم ایران اصلاً از اینترنت استفاده نمی‌کنند

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

مطلبی وجود ندارد

داغ‌ترین‌های روز

آمریکا موشک مافوق صوت عقاب سیاه را مخفیانه آزمایش کرد

آمریکا موشک مافوق صوت عقاب سیاه را مخفیانه آزمایش کرد

10 اردیبهشت 1404
موفقیت ارتش و نیروی دریایی ایالات متحده در آزمایش موشک هایپرسونیک

موفقیت ارتش و نیروی دریایی آمریکا در آزمایش موشک هایپرسونیک

24 آذر 1403
پرتابگر زمینی موشک مافوق‌صوت دارک ایگل ارتش آمریکا

موشک مافوق‌صوت جدید آمریکا با سرعت بیش از ۵ ماخ معرفی شد

25 آذر 1404

چگونه پیام های واتساپ را بعد از ارسال ویرایش کنیم؟

19 تیر 1402 - به‌روزشده در 4 آبان 1404

 پروتکل VLESS چیست و چه کاربردهایی دارد؟

25 آذر 1402 - به‌روزشده در 27 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

عامل‌های هوش مصنوعی

عامل‌های هوش مصنوعی اکنون کیف پول‌های بیت‌کوینی می‌سازند که انسان‌ها به آن دسترسی ندارند

13 بهمن 1404
کاردانو

ورود قیمت کاردانو به ناحیه کلیدی تقاضا

13 بهمن 1404
اتریوم

آیا قیمت اتریوم تحت فشار توزیع قرار گرفته است؟

13 بهمن 1404
بیت کوین

دلایل اصلی احتمال آزمایش دوباره سطح ۷۵ هزار برای بیت کوین در روزهای آتی

13 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir