• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » دیپ‌سیک OCR امکان پردازش ۲۰۰ هزار صفحه مدارک را دارد

دیپ‌سیک OCR امکان پردازش ۲۰۰ هزار صفحه مدارک را دارد

اسما کلهر نوشته شده توسط اسما کلهر
چهارشنبه 30 مهر 1404 - 23:55
در اخبار هوش مصنوعی, فناوری
Nvidia_A100_GPU_Ampere
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت دیپ‌سیک (DeepSeek) از یک مدل هوش مصنوعی متن‌باز جدید با نام DeepSeek OCR رونمایی کرده است که می‌تواند صنعت یادگیری ماشین را متحول کند.

به گزارش تکناک، این مدل قادر است روزانه بیش از ۲۰۰,۰۰۰ صفحه سند را تنها با استفاده از یک پردازنده گرافیکی انویدیا A100 پردازش و یاد بگیرد؛ دستاوردی که به لطف الگوریتم‌های فشرده‌سازی و کدگذاری نوری پیشرفته آن ممکن شده است.

در دورانی که هزینه‌های سرسام‌آور مراکز داده هوش مصنوعی و پردازش داده به یک چالش اصلی برای شرکت‌های فناوری تبدیل شده، تمرکز بر کارایی الگوریتم‌ها اهمیت ویژه‌ای یافته است. دیپ‌سیک با ارائه مدل‌های متن‌باز که هزینه آموزش بسیار کمتری نسبت به غول‌هایی مانند ChatGPT شرکت OpenAI یا Gemini شرکت گوگل دارند، در این زمینه پیشرو بوده است.

به نقل از نوتبوک‌چک، مدل DeepSeek-OCR با استفاده از یک تکنیک نوآورانه به نام «نگاشت نوری»، اسناد بسیار طولانی را به تصاویر فشرده تبدیل می‌کند. این سیستم می‌تواند بیش از ۹ توکن متنی را به یک توکن بصری واحد تبدیل کند که این امر منابع محاسباتی مورد نیاز برای پردازش محتوا را به شکل چشمگیری کاهش می‌دهد. این مدل حتی با نسبت فشرده‌سازی ۱۰ برابری، به دقت تشخیص ۹۷ درصدی دست می‌یابد و در نسبت فشرده‌سازی ۲۰ برابری نیز دقت ۶۰ درصدی را حفظ می‌کند که در نوع خود بی‌سابقه است.

این دستاورد در مقیاس بزرگتر شگفت‌انگیزتر می‌شود: یک خوشه محاسباتی متشکل از ۲۰ پردازنده A100 می‌تواند روزانه ۳۳ میلیون صفحه سند را پردازش کند. این یک تغییر پارادایم در نحوه آموزش مدل‌های زبانی بزرگ مبتنی بر متن است. بر اساس رتبه‌بندی بنچمارک OmniDocBench، مدل DeepSeek-OCR رقبای محبوبی مانند GOT-OCR2.0 و MinerU2.0 را با اختلاف زیادی پشت سر می‌گذارد.

deepseek-ocr-chinas-new-ai-model-generates-200k-pages-a-day-on-one-gpu

توانایی‌های DeepSeek OCR به پردازش متون ساده محدود نمی‌شود. این مدل با تکیه بر معماری پیشرفته «ترکیب-متخصصان» (Mixture-of-Experts)، قادر است اسناد پیچیده حاوی نمودار، فرمول‌های علمی، دیاگرام و تصاویر را حتی زمانی که به چندین زبان نوشته شده باشند، با دقت بالا پردازش کند. این موفقیت حاصل آموزش مدل بر روی مجموعه داده‌ای عظیم شامل ۳۰ میلیون صفحه PDF به نزدیک به ۱۰۰ زبان مختلف بوده است.

با وجود اینکه سرعت و کارایی سیستم جدید DeepSeek-OCR غیرقابل انکار است، یک پرسش کلیدی باقی می‌ماند: آیا این کارایی فوق‌العاده در پردازش و توکن‌سازی، در نهایت به بهبود عملکرد مدل زبانی در زمینه استدلال و درک واقعی مفاهیم نیز منجر خواهد شد؟ پاسخ به این سؤال، آینده این رویکرد نوآورانه را مشخص خواهد کرد.

اسما کلهر

اسما کلهر

دانش آموخته مترجمی زبان انگلیسی ،نویسنده حوزه تکنولوژی

مطالب مرتبط

Tools for Humanity’s iris-scanning orb
امنیت سایبری

اسکن عنبیه چشم؛ راهکار شرکت‌ها برای مقابله با هویت‌های جعلی و ربات‌های هوش مصنوعی

نوشته شده توسط امیرحسین یونس
30 مهر 1404
تعدیل ۶۰۰ نفر از کارمندان بخش هوش مصنوعی متا؛ دپارتمان Meta AI کوچک می‌شود
اخبار هوش مصنوعی

تعدیل ۶۰۰ نفر از کارمندان بخش هوش مصنوعی متا؛ دپارتمان Meta AI کوچک می‌شود

نوشته شده توسط تارخ ترهنده
30 مهر 1404
حذف ChatGPT از واتساپ
اخبار هوش مصنوعی

متا ChatGPT را از واتساپ ۵۰ میلیون کاربر حذف می‌کند

نوشته شده توسط تارخ ترهنده
30 مهر 1404
خطرات روانی ChatGPT
اخبار هوش مصنوعی

کاربران از ChatGPT به‌دلیل توهم و پارانویا شکایت کردند

نوشته شده توسط تارخ ترهنده
30 مهر 1404
استفاده نتفلیکس از هوش مصنوعی
اخبار هوش مصنوعی

استفاده از هوش مصنوعی در رسانه‌ها و تبلیغات نتفلیکس دو برابر می‌‌شود

نوشته شده توسط امیرحسین یونس
30 مهر 1404

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

کالکشن ویکتوری کاویار آیفون ۱۷ پرو و پرو مکس

کاویار نسخه ۱۰ هزار دلاری آیفون ۱۷ پرو از کالکشن لوکس ویکتوری را رونمایی کرد

12 مهر 1404 - به‌روزشده در 13 مهر 1404
ساخت نخستین تراشه هیبریدی دوبعدی-سیلیکونی جهان با بازده ۹۴ درصدی در چین

ساخت نخستین تراشه هیبریدی دوبعدی-سیلیکونی جهان با بازده ۹۴ درصدی در چین

19 مهر 1404

داغ‌ترین‌های روز

شیائومی به‌روزرسانی امنیتی جدیدی را برای بیش از ۲۰ گوشی ردمی و پوکو منتشر کرد

به‌روزرسانی امنیتی جدید شیائومی برای بیش از ۲۰ گوشی ردمی و پوکو منتشر شد

29 مهر 1404
مرورگر ChatGPT Atlas

OpenAI مرورگر ChatGPT Atlas را برای رقابت با سافاری و کروم منتشر کرد

29 مهر 1404
مقایسه گلکسی S25 FE با S24 FE

مقایسه گلکسی S25 FE با S24 FE؛ ارتقا واقعی یا تکرار هوشمندانه؟

27 مهر 1404 - به‌روزشده در 30 مهر 1404
ساعت ماشین‌حسابی کاسیو

نوستالژی در اوج؛ ساعت ماشین‌حسابی کاسیو با تم فیلم «بازگشت به آینده»

24 مهر 1404 - به‌روزشده در 26 مهر 1404
: موتورسیکلت Yamaha MOTOROiD:Λ در حالت خوابیده روی زمین، آماده برای ایستادن خودکار بدون دخالت انسان.

موتورسیکلت جدید یاماها پس از زمین خوردن دوباره می‌ایستد + ویدیو

29 مهر 1404 - به‌روزشده در 30 مهر 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

Nvidia_A100_GPU_Ampere

دیپ‌سیک OCR امکان پردازش ۲۰۰ هزار صفحه مدارک را دارد

30 مهر 1404
Apple removes controversial dating apps from App Store

اپل اپلیکیشن‌های جنجالی دوست‌یابی را از اپ استور حذف کرد

30 مهر 1404
Reddit sues Perplexity

ردیت از پرپلکسیتی شکایت کرد؛ استفاده غیرقانونی از محتوای کاربران برای آموزش هوش مصنوعی

30 مهر 1404
Lenovo_LOQ_Essential_15ARP10E

لنوو از لپ‌تاپ گیمینگ اقتصادی با پردازنده رایزن رونمایی کرد

30 مهر 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir