• صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه
No Result
مشاهده تمامی نتایج
اخبار تکنولوژی روز جهان و ایران

تک ناک » فناوری » اخبار هوش مصنوعی » دیپ‌سیک OCR امکان پردازش ۲۰۰ هزار صفحه مدارک را دارد

دیپ‌سیک OCR امکان پردازش ۲۰۰ هزار صفحه مدارک را دارد

اسما کلهر نوشته شده توسط اسما کلهر
چهارشنبه 30 مهر 1404 - 23:55
در اخبار هوش مصنوعی, فناوری
Nvidia_A100_GPU_Ampere
کپی لینکاشتراک گذاری در تلگراماشتراک گذاری در توییتر

شرکت دیپ‌سیک (DeepSeek) از یک مدل هوش مصنوعی متن‌باز جدید با نام DeepSeek OCR رونمایی کرده است که می‌تواند صنعت یادگیری ماشین را متحول کند.

به گزارش تکناک، این مدل قادر است روزانه بیش از ۲۰۰,۰۰۰ صفحه سند را تنها با استفاده از یک پردازنده گرافیکی انویدیا A100 پردازش و یاد بگیرد؛ دستاوردی که به لطف الگوریتم‌های فشرده‌سازی و کدگذاری نوری پیشرفته آن ممکن شده است.

در دورانی که هزینه‌های سرسام‌آور مراکز داده هوش مصنوعی و پردازش داده به یک چالش اصلی برای شرکت‌های فناوری تبدیل شده، تمرکز بر کارایی الگوریتم‌ها اهمیت ویژه‌ای یافته است. دیپ‌سیک با ارائه مدل‌های متن‌باز که هزینه آموزش بسیار کمتری نسبت به غول‌هایی مانند ChatGPT شرکت OpenAI یا Gemini شرکت گوگل دارند، در این زمینه پیشرو بوده است.

به نقل از نوتبوک‌چک، مدل DeepSeek-OCR با استفاده از یک تکنیک نوآورانه به نام «نگاشت نوری»، اسناد بسیار طولانی را به تصاویر فشرده تبدیل می‌کند. این سیستم می‌تواند بیش از ۹ توکن متنی را به یک توکن بصری واحد تبدیل کند که این امر منابع محاسباتی مورد نیاز برای پردازش محتوا را به شکل چشمگیری کاهش می‌دهد. این مدل حتی با نسبت فشرده‌سازی ۱۰ برابری، به دقت تشخیص ۹۷ درصدی دست می‌یابد و در نسبت فشرده‌سازی ۲۰ برابری نیز دقت ۶۰ درصدی را حفظ می‌کند که در نوع خود بی‌سابقه است.

این دستاورد در مقیاس بزرگتر شگفت‌انگیزتر می‌شود: یک خوشه محاسباتی متشکل از ۲۰ پردازنده A100 می‌تواند روزانه ۳۳ میلیون صفحه سند را پردازش کند. این یک تغییر پارادایم در نحوه آموزش مدل‌های زبانی بزرگ مبتنی بر متن است. بر اساس رتبه‌بندی بنچمارک OmniDocBench، مدل DeepSeek-OCR رقبای محبوبی مانند GOT-OCR2.0 و MinerU2.0 را با اختلاف زیادی پشت سر می‌گذارد.

deepseek-ocr-chinas-new-ai-model-generates-200k-pages-a-day-on-one-gpu

توانایی‌های DeepSeek OCR به پردازش متون ساده محدود نمی‌شود. این مدل با تکیه بر معماری پیشرفته «ترکیب-متخصصان» (Mixture-of-Experts)، قادر است اسناد پیچیده حاوی نمودار، فرمول‌های علمی، دیاگرام و تصاویر را حتی زمانی که به چندین زبان نوشته شده باشند، با دقت بالا پردازش کند. این موفقیت حاصل آموزش مدل بر روی مجموعه داده‌ای عظیم شامل ۳۰ میلیون صفحه PDF به نزدیک به ۱۰۰ زبان مختلف بوده است.

با وجود اینکه سرعت و کارایی سیستم جدید DeepSeek-OCR غیرقابل انکار است، یک پرسش کلیدی باقی می‌ماند: آیا این کارایی فوق‌العاده در پردازش و توکن‌سازی، در نهایت به بهبود عملکرد مدل زبانی در زمینه استدلال و درک واقعی مفاهیم نیز منجر خواهد شد؟ پاسخ به این سؤال، آینده این رویکرد نوآورانه را مشخص خواهد کرد.

اسما کلهر

اسما کلهر

دانش آموخته مترجمی زبان انگلیسی ،نویسنده حوزه تکنولوژی

مطالب مرتبط

نمایش لوگو و نام ChatGPT بر روی صفحه نمایش یک گوشی هوشمند که روی کیبورد یک لپ‌تاپ قرار دارد؛ تصویری نمادین از دسترسی گسترده به هوش مصنوعی مولد.
اخبار هوش مصنوعی

ChatGPT طرح میان‌رده ۱۰۰ دلاری Pro Lite را معرفی می‌کند

نوشته شده توسط تارخ ترهنده
4 اسفند 1404
دست رباتیک در حال تعامل با صفحه‌کلید کامپیوتر در مقابل عبارت Artificial Intelligence؛ نمایش مفهوم اتوماسیون، هوش مصنوعی و فناوری‌های پیشرفته
اخبار هوش مصنوعی

جایگزینی پیمان‌کاران با Agentic AI؛ زنگ‌خطر برای کارمندان

نوشته شده توسط تارخ ترهنده
4 اسفند 1404
تصویر مفهومی دیتاسنتر مشترک Oracle و OpenAI؛ نمایش همکاری استراتژیک برای تقویت زیرساخت‌های ابری و پردازش سنگین هوش مصنوعی.
اخبار هوش مصنوعی

جزئیات توافق نفس‌گیر OpenAI و سافت‌بنک در پروژه استارگیت

نوشته شده توسط تارخ ترهنده
4 اسفند 1404
نمایش لوگوی مایکروسافت (چهار رنگ) در کنار لوگوی جدید Microsoft Copilot که نشان‌دهنده ادغام هوش مصنوعی در اکوسیستم ویندوز و آفیس است
اخبار هوش مصنوعی

جنجال جدید مایکروسافت با تبلیغ کوپایلت در ویندوز بالاتر از فایل اکسپلورر

نوشته شده توسط تارخ ترهنده
4 اسفند 1404
تعامل با ChatGPT
اخبار هوش مصنوعی

فراتر از ابزار کاری؛ تحلیل عجیب رفتار کاربران ChatGPT

نوشته شده توسط مانی
4 اسفند 1404
خبر بعدی
اعتراف اینستاگرام به شکست در تشخیص محتوای تولیدشده با هوش مصنوعی

اینستاگرام قابلیت آیکون‌های سفارشی را فقط برای نوجوانان عرضه کرد

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

آذرآنلاین آذرآنلاین آذرآنلاین

پیشنهادی

آموزش گام‌به‌گام استخراج سیگنال معاملاتی از اخبار ارز دیجیتال با هوش مصنوعی

آموزش گام‌به‌گام استخراج سیگنال معاملاتی از اخبار ارز دیجیتال با هوش مصنوعی

3 اسفند 1404
هوش مصنوعی جایگزین کارمندان اداری می‌ شود

هوش مصنوعی جایگزین کارمندان اداری می‌ شود

25 بهمن 1404

داغ‌ترین‌های روز

از ایده تا پرواز پهپاد ونوم در ۷۱ روز؛ پروژه‌ای که معادلات پهپادی را تغییر می‌ دهد

از ایده تا پرواز پهپاد ونوم در ۷۱ روز؛ پروژه‌ای که معادلات پهپادی را تغییر می‌ دهد

2 اسفند 1404
نمای پشتی گوشی Realme با طراحی مینیمال و ماژول دوربین دوگانه، قرارگرفته روی صخره در پس‌زمینه ساحل هنگام غروب

گوشی اقتصادی ریلمی P4 لایت با باتری ۶۳۰۰ میلی‌آمپرساعتی معرفی شد

1 اسفند 1404 - به‌روزشده در 2 اسفند 1404
دادگاه روسیه گوگل را به پرداخت ۱.۲ کوینتیلیون دلار محکوم کرد

دادگاه روسیه گوگل را به پرداخت ۱.۲ کوینتیلیون دلار محکوم کرد

2 اسفند 1404
نمای نزدیک از پردازنده Intel Core نصب‌شده روی مادربورد، با نمایش مسیرهای داده و مدارهای دیجیتال، نشان‌دهنده عملکرد بالا و پردازش پیشرفته

بازگشت مقتدرانه به سوکت محبوب؛ همه‌چیز درباره پردازنده‌های Bartlett Lake اینتل

2 اسفند 1404 - به‌روزشده در 3 اسفند 1404
مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

مایکروسافت دسترسی به فایل‌های ISO ویندوز ۱۱ را مسدود کرد

28 بهمن 1404 - به‌روزشده در 29 بهمن 1404
Technoc

دنیا با سرعتی خیره کننده به سمت تحقق رویاهایی می رود که تا دیروز دست نیافتنی و محال بود و بشر با گذر از دریایی از موانع یک به یک در حال تحقق آنها است.

ما در” تک ناک” تلاش می کنیم سهمی از انعکاس تحولات بی شمار فناوری و اخبار تکنولوژی داشته باشیم و در این کهکشان بی انتهای یافته های علمی و دانش محور محتوایی قابل اتکاء و اخباری موثق را از گوشه و کنار دنیا در اختیار علاقمندان و مخاطبان خود قرار دهیم.

ما را در شبکه های اجتماعی دنبال کنید

تازه‌ها

نمایش لوگو و نام ChatGPT بر روی صفحه نمایش یک گوشی هوشمند که روی کیبورد یک لپ‌تاپ قرار دارد؛ تصویری نمادین از دسترسی گسترده به هوش مصنوعی مولد.

ChatGPT طرح میان‌رده ۱۰۰ دلاری Pro Lite را معرفی می‌کند

4 اسفند 1404
رندرهای مفهومی آیفون ۱۸ پرو و آیفون ۱۸ پرو مکس با رنگ جدید زرشکی تیره (Deep Burgundy)؛ نمایش طراحی پنل پشتی و صفحه نمایش در کنار هم.

اپل تولید آزمایشی آیفون ۱۸ پرو و پرو مکس را شروع کرد

4 اسفند 1404
نمای نزدیک لبه فلزی گوشی Samsung Galaxy S26 Ultra، با جزئیات دکمه پاور و قلم S Pen که به صورت برجسته نمایش داده شده است.

شوک سامسونگ به طرف‌داران؛ حذف بلوتوث قلم S Pen گلکسی S26 اولترا

4 اسفند 1404
دست رباتیک در حال تعامل با صفحه‌کلید کامپیوتر در مقابل عبارت Artificial Intelligence؛ نمایش مفهوم اتوماسیون، هوش مصنوعی و فناوری‌های پیشرفته

جایگزینی پیمان‌کاران با Agentic AI؛ زنگ‌خطر برای کارمندان

4 اسفند 1404

دسترسی سریع

  • فناوری
  • کامپیوتر و موبایل
  • نقد و بررسی
  • آموزش
  • ارز دیجیتال
  • علمی
  • کسب و کار
  • وسائل نقلیه
  • بازی و سرگرمی
  • چند رسانه ای
  • صفحه اصلی
  • همه اخبار
  • تبلیغات تکناک
  • درباره ما
  • تماس با ما

© Copyright 2025 Technoc.ir

No Result
مشاهده تمامی نتایج
  • فناوری
    • اخبار هوش مصنوعی
    • رباتیک
    • اینترنت و شبکه
    • شبکه های اجتماعی
    • هوافضا
    • معماری
    • ورزش
    • رویداد ها
    • دوربین دیجیتال
  • کامپیوتر و موبایل
    • موبایل و تبلت
    • لپ تاپ و کامپیوتر
    • اپلیکیشن موبایل
    • نرم افزار
    • سخت افزار
    • ساعت هوشمند
    • مانیتور
    • اسپیکر و هدفون
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
  • نقد و بررسی
    • بررسی موبایل و تبلت
    • کنسول بازی
    • بررسی لپ تاپ و کامپیوتر
    • قطعات کامپیوتر
    • نرم افزار
    • بررسی اسپیکر و هدفون
    • بررسی ساعت هوشمند
  • آموزش
    • سیستم عامل موبایل
    • سیستم عامل کامپیوتر
    • آموزش هوش مصنوعی
    • سخت افزار
  • اخبار ارز دیجیتال
    • قیمت لحظه ای ارز دیجیتال
    • ماشین حساب ارز دیجیتال
    • آموزش ارز دیجیتال
  • علمی
    • سلامت و پزشکی
    • انرژی
    • فیزیک
    • شیمی
    • نجوم
    • ورزش
    • محیط زیست
    • باستان شناسی
  • کسب و کار
    • شرکت ها
    • بورس
    • مدیریت(پروژه، کسب و کار، منابع انسانی)
    • استارتاپ ها
    • دولت الکترونیک
    • رویداد کسب و کار
  • وسائل نقلیه
    • خودرو
    • دوچرخه
    • موتور سیکلت
    • قطار
    • هواپیما
  • بازی و سرگرمی
    • کنسول بازی های کامپیوتری
    • بازی های کامپیوتر
    • بازی کنسول
    • بازی موبایل
    • فیلم و سریال
  • چند رسانه ای
    • عکس
    • ویدئو
  • اخبار داخلی
    • دانش بنیان
    • دولت الکترونیک
    • رویداد داخلی
    • بازار
    • دانشگاه

© Copyright 2025 Technoc.ir