• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » انتشار مدل جدید دیپ سیک با کاهش چشمگیر هزینه استنتاج

انتشار مدل جدید دیپ سیک با کاهش چشمگیر هزینه استنتاج

سید محمد برازنده نوشته شده توسط سید محمد برازنده
سه شنبه 8 مهر 1404 - 11:55
در اخبار هوش مصنوعی, فناوری
انتشار مدل جدید DeepSeek با کاهش چشمگیر هزینه استنتاج
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

پژوهشگران شرکت DeepSeek روز دوشنبه از یک مدل آزمایشی جدید با نام V3.2-exp رونمایی کردند که هدف اصلی آن کاهش چشمگیر هزینه استنتاج در عملیات‌های متنی طولانی است.

به گزارش تک‌ناک، این مدل از طریق پلتفرم Hugging Face معرفی شد و مقاله علمی مرتبط با آن نیز در GitHub منتشر شده است.

مهم‌ترین ویژگی این مدل، فناوری جدیدی به نام DeepSeek Sparse Attention است. در این سیستم، یک ماژول موسوم به lightning indexer بخش‌های کلیدی از پنجره متنی را اولویت‌بندی می‌کند. سپس سامانه دیگری با عنوان fine-grained token selection system توکن‌های دقیق‌تری را از میان آن بخش‌ها انتخاب و وارد پنجره توجه محدود مدل می‌کند. ترکیب این دو فرایند باعث می‌شود که مدل بتواند بخش‌های وسیعی از متن را با بار محاسباتی و هزینه سرور بسیار کمتر پردازش کند.

طبق آزمایش‌های اولیه DeepSeek، استفاده از این روش می‌تواند هزینه یک فراخوانی ساده API را در سناریوهای متنی طولانی تا نصف کاهش دهد. البته این نتایج هنوز نیازمند بررسی‌های مستقل و دقیق‌تر هستند، اما به دلیل انتشار آزاد و در دسترس بودن وزن‌های مدل در Hugging Face، انتظار می‌رود که به‌زودی آزمایش‌های شخص ثالث، صحت این ادعاها را بررسی کنند.

مدل جدید DeepSeek بخشی از روند کلی تلاش‌های اخیر برای کاهش هزینه‌های استنتاج است؛ هزینه‌هایی که مربوط به اجرای مدل‌های از پیش آموزش‌دیده روی سرورها است و با هزینه‌های آموزش اولیه تفاوت دارد. پژوهشگران DeepSeek با تمرکز بر بهینه‌سازی معماری ترانسفورمر نشان داده‌اند که همچنان ظرفیت‌های زیادی برای بهبود عملکرد و کاهش هزینه وجود دارد.

مدل جدید DeepSeek با کاهش چشمگیر هزینه استنتاج منتشر شد

شرکت DeepSeek که مقر آن در چین است، در سال‌های اخیر حضوری متفاوت در رقابت جهانی هوش مصنوعی داشته است. این شرکت در ابتدای سال با مدل R1 خبرساز شد؛ مدلی که با استفاده گسترده از یادگیری تقویتی و با هزینه‌ای بسیار کمتر از رقبای آمریکایی آموزش داده شد. با وجود این، برخلاف پیش‌بینی‌ها، R1 باعث انقلابی گسترده در روند آموزش مدل‌ها نشد و نام این شرکت مدتی در حاشیه قرار گرفت.

اکنون فناوری “Sparse Attention” به احتمال زیاد هیاهوی مدل R1 را تکرار نخواهد کرد، اما می‌تواند برای ارائه‌دهندگان آمریکایی الگویی کاربردی باشد تا هزینه‌های بالای استنتاج را کاهش دهند و راهکارهای جدیدی برای کارایی بیشتر در اختیار صنعت قرار دهد.

سید محمد برازنده

سید محمد برازنده

کارشناسی مترجمی زبان فرانسه. از سال 87 تاکنون در حوزه های مختلف سابقه ترجمه دارم. بیش از یک سال هست که مترجم حوزه فناوری تو سایت تک ناک هستم.

مطالب مرتبط

ساعت لگویی؛ شاهکار مکانیکی که زمان را از ثانیه تا سال‌های کهکشانی می‌ سنجد
فناوری

ساعت لگویی زمان را از ثانیه تا سال‌های کهکشانی می‌ سنجد + ویدیو

نوشته شده توسط مانی
13 بهمن 1404
آزمایش موشک جدید استارشیپ به اواسط مارس موکول شد
فناوری

آزمایش موشک جدید استارشیپ به اواسط مارس موکول شد

نوشته شده توسط نرگس چالوک
13 بهمن 1404
نمونهٔ آزمایشگاهی یک ربات پرندهٔ هم‌اندازهٔ حشره که با بال‌های نازک و سامانهٔ الکترونیکی سبک، حرکت و تعادل را شبیه‌سازی می‌کند.
فناوری

الهام از زنبورها برای ساخت تراشه‌ ناوبری ربات‌های هم‌اندازه حشرات

نوشته شده توسط نرگس چالوک
12 بهمن 1404
ظهور شبکه اجتماعی مولت‌بوک که برای عامل‌های هوش مصنوعی طراحی شده است
اخبار هوش مصنوعی

ظهور شبکه اجتماعی مولت‌بوک که برای عامل‌های هوش مصنوعی طراحی شده است

نوشته شده توسط سید محمد برازنده
12 بهمن 1404
نمای نزدیک از لحیم‌کاری یک قطعه الکترونیکی که تصویر آن به‌صورت زنده روی صفحه‌ی تلفن هوشمند کنار میز کار نمایش داده می‌شود.
پیشنهاد سردبیر

هویه‌ هوشمند مجهز به دوربین، تجربه‌ لحیم‌کاری را متحول می‌کند

نوشته شده توسط نرگس چالوک
12 بهمن 1404
خبر بعدی
یوتیوب با پرداخت ۲۴.۵ میلیون دلار به شکایت ترامپ پایان داد

یوتیوب با پرداخت ۲۴.۵ میلیون دلار به شکایت ترامپ پایان داد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

مطلبی وجود ندارد

داغ‌ترین‌های روز

آمریکا موشک مافوق صوت عقاب سیاه را مخفیانه آزمایش کرد

آمریکا موشک مافوق صوت عقاب سیاه را مخفیانه آزمایش کرد

10 اردیبهشت 1404
پرتابگر زمینی موشک مافوق‌صوت دارک ایگل ارتش آمریکا

موشک مافوق‌صوت جدید آمریکا با سرعت بیش از ۵ ماخ معرفی شد

25 آذر 1404
موفقیت ارتش و نیروی دریایی ایالات متحده در آزمایش موشک هایپرسونیک

موفقیت ارتش و نیروی دریایی آمریکا در آزمایش موشک هایپرسونیک

24 آذر 1403
6 دلیل برتری ویرایشگر ویدئو CapCut نسبت به Premiere Rush

۶ دلیل برتری ویرایشگر ویدئو CapCut نسبت به Premiere Rush

15 مهر 1403
این لپ تاپ لنوو همزمان اندروید و ویندوز ۱۱ را اجرا می کند

این لپ تاپ لنوو همزمان اندروید و ویندوز ۱۱ را اجرا می کند

16 مرداد 1403
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

عامل‌های هوش مصنوعی

عامل‌های هوش مصنوعی اکنون کیف پول‌های بیت‌کوینی می‌سازند که انسان‌ها به آن دسترسی ندارند

13 بهمن 1404
کاردانو

ورود قیمت کاردانو به ناحیه کلیدی تقاضا

13 بهمن 1404
اتریوم

آیا قیمت اتریوم تحت فشار توزیع قرار گرفته است؟

13 بهمن 1404
بیت کوین

دلایل اصلی احتمال آزمایش دوباره سطح ۷۵ هزار برای بیت کوین در روزهای آتی

13 بهمن 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir