ابزار Mistral OCR با بهرهگیری از هوش مصنوعی معرفی شد و امکان تبدیل دقیق اسناد پیچیده به فایلهای قابل ویرایش را فراهم میکند. این فناوری پیشرفته قادر است متون، جداول و نمودارهای موجود در اسناد را با دقت بالا تشخیص داده و پردازش کند.
به گزارش تکناک، شرکت Mistral از محصول جدید خود با نام Mistral OCR رونمایی کرده است؛ یک رابط برنامهنویسی (API) تشخیص نویسه نوری (OCR) مبتنی بر هوش مصنوعی که امکان تبدیل سریع و دقیق اسناد چاپی و فایلهای غیرقابل ویرایش را به فایلهای دیجیتال قابل ویرایش فراهم میکند.
میلیونها سند چاپی و فایل PDF غیرقابل ویرایش، از جمله کتابهای قدیمی، سوابق تاریخی و اسناد بایگانیشده، همچنان در فرمتهای غیرقابل پردازش باقی ماندهاند. نرمافزارهای تشخیص نویسه نوری، متن و قالببندی این منابع را به فرمتهای دیجیتال تبدیل میکنند. بااینحال، بسیاری از ابزارهای OCR موجود در پردازش جداول پیچیده، نمودارها و زبانهای خارجی با مشکل مواجه میشوند.
به نقل نوتبوکچک، Mistral OCR با هدف رفع این چالشها توسعه یافته است و از هوش مصنوعی پیشرفته برای تشخیص متن و ساختار اسناد چندزبانه و پیچیده استفاده میکند. این ابزار جدید، دقتی بین ۹۷٪ تا ۹۹٫۵۴٪ را در پردازش متون ۱۱ زبان مختلف ارائه میدهد که از نرمافزارهای OCR مایکروسافت و گوگل عملکرد بهتری دارد. همچنین، در پردازش اسناد پیچیده مانند متون علمی، جداول ریاضی و اسناد فنی دقت بیشتری نسبت به سایر رقبا دارد.
Mistral OCR API در حال حاضر برای پردازش اسنادی با حجم کمتر از ۵۰ مگابایت و حداکثر ۱,۰۰۰ صفحه قابل استفاده است. کاربران برای پردازش اسناد چاپی، ابتدا باید آنها را با دیجیتالی کنند. اما فایلهای PDF، تصاویر و صفحات وب بدون نیاز به مراحل اضافی میتوانند مستقیماً توسط این API پردازش شوند.


با معرفی این ابزار، انتظار میرود که کسبوکارها، مراکز بایگانی، ناشران و سازمانهای دولتی بتوانند فرآیند دیجیتالیسازی اسناد را با سرعت و دقت بیشتری انجام دهند. هنوز اطلاعاتی درباره قیمتگذاری و نحوه دسترسی به این API منتشر نشده است، اما احتمال میرود Mistral در آینده نزدیک بستههای اشتراکی یا مدلهای پرداختی مختلفی را برای کاربران ارائه دهد.
