معرفی ابزار جدید هوش مصنوعی Mistral OCR برای تبدیل اسناد چاپی به فایل‌های دیجیتال

ابزار Mistral OCR با بهره‌گیری از هوش مصنوعی معرفی شد و امکان تبدیل دقیق اسناد پیچیده به فایل‌های قابل ویرایش را فراهم می‌کند. این فناوری پیشرفته قادر است متون، جداول و نمودارهای موجود در اسناد را با دقت بالا تشخیص داده و پردازش کند.

به گزارش تکناک، شرکت Mistral از محصول جدید خود با نام Mistral OCR رونمایی کرده است؛ یک رابط برنامه‌نویسی (API) تشخیص نویسه نوری (OCR) مبتنی بر هوش مصنوعی که امکان تبدیل سریع و دقیق اسناد چاپی و فایل‌های غیرقابل ویرایش را به فایل‌های دیجیتال قابل ویرایش فراهم می‌کند.

میلیون‌ها سند چاپی و فایل PDF غیرقابل ویرایش، از جمله کتاب‌های قدیمی، سوابق تاریخی و اسناد بایگانی‌شده، همچنان در فرمت‌های غیرقابل پردازش باقی مانده‌اند. نرم‌افزارهای تشخیص نویسه نوری، متن و قالب‌بندی این منابع را به فرمت‌های دیجیتال تبدیل می‌کنند. بااین‌حال، بسیاری از ابزارهای OCR موجود در پردازش جداول پیچیده، نمودارها و زبان‌های خارجی با مشکل مواجه می‌شوند.

به نقل نوتبوک‌چک، Mistral OCR با هدف رفع این چالش‌ها توسعه یافته است و از هوش مصنوعی پیشرفته برای تشخیص متن و ساختار اسناد چندزبانه و پیچیده استفاده می‌کند. این ابزار جدید، دقتی بین ۹۷٪ تا ۹۹٫۵۴٪ را در پردازش متون ۱۱ زبان مختلف ارائه می‌دهد که از نرم‌افزارهای OCR مایکروسافت و گوگل عملکرد بهتری دارد. همچنین، در پردازش اسناد پیچیده مانند متون علمی، جداول ریاضی و اسناد فنی دقت بیشتری نسبت به سایر رقبا دارد.

Mistral OCR API در حال حاضر برای پردازش اسنادی با حجم کمتر از ۵۰ مگابایت و حداکثر ۱,۰۰۰ صفحه قابل استفاده است. کاربران برای پردازش اسناد چاپی، ابتدا باید آن‌ها را با دیجیتالی کنند. اما فایل‌های PDF، تصاویر و صفحات وب بدون نیاز به مراحل اضافی می‌توانند مستقیماً توسط این API پردازش شوند.

Mistral OCR تبدیل متن را در ده ها زبان بهتر از رقبا انجام می دهد

Mistral OCR در اسناد پیچیده بهتر از رقبا عمل می کند

با معرفی این ابزار، انتظار می‌رود که کسب‌وکارها، مراکز بایگانی، ناشران و سازمان‌های دولتی بتوانند فرآیند دیجیتالی‌سازی اسناد را با سرعت و دقت بیشتری انجام دهند. هنوز اطلاعاتی درباره قیمت‌گذاری و نحوه دسترسی به این API منتشر نشده است، اما احتمال می‌رود Mistral در آینده نزدیک بسته‌های اشتراکی یا مدل‌های پرداختی مختلفی را برای کاربران ارائه دهد.