ООО «ПРАЙ» представляет технологию по распознаванию неструктурированных документов Detector PRAI.
Каждая компания однажды задумывается над тем, чтобы оцифровать все бумаги и документы, которые десятками лет хранятся в архивах. Это может помочь создать собственную базу знаний, а возможно, даже разработать виртуального ИИ помощника, обучив его искать ответы не в глобальной сети, а именно в вашей практике.
Оцифровка документов — занятие нужное, но не сильно увлекательное. Если у документа нет чёткой структуры, они полны таблиц различных видов, текстов в несколько колонок, формул, картинок и графиков — раньше приходилось часами разбирать и перепечатывать вручную даже распознанные тексты.
Технология Detector PRAI легко справляется с распознаванием журналов со специфичной вёрсткой, газет с несколькими полосами, технической документации, научной, художественной литературы.
Что такое PRAI Detector
PRAI Detector — это технология распознавания неструктурированных документов, которая сочетает в себе передовую OCR-технологию и умные алгоритмы, способные распознавать текст, таблицы, формулы и изображения даже в самых хаотичных документах: журналах, газетах с несколькими колонками и сложной вёрсткой, научных работах с формулами, технической документации, с таблицами разных цветов. А главное — после распознавания данные сразу готовы к работе: редактируйте, исправляйте, проверяйте правописание — всё в одном месте. Быстро, удобно и экономит время и нервы.
У Detector есть ряд преимуществ
– Отечественная разработка — никаких рисков, что завтра продукт уйдёт с рынка или попадёт под санкции.
– Научная база и алгоритмы высокого уровня.
– Возможность распознавать любые документы, таблицы и формулы с сохранением структуры.
– Гибкая интеграция под конкретные бизнес-задачи.
Особенности распознавания сложных элементов
Особый акцент сделан на распознавание таблиц внутри текста. Технология распознаёт таблицы любых видов: без видимых границ, с двойными линиями, цветными ячейками. Стандартные методы распознавания чаще всего определяют такие таблицы, как картинки, или записывают слова из ячеек непрерывным текстом. Detector сохраняет структуру таких элементов.
Для удобства научных и технических специалистов, инженеров Detector умеет распознавать формулы и передавать их в формате для LaTex.
Работая над сложной задачей, мы не забыли и об относительно простых. Detector PRAI без проблем справляется и с распознаванием структурированных документов, таких как паспорт, права или счёт-фактура. Получается «два в одном»: сложные и простые задачи решаются одной технологией.
Технологию можно легко адаптировать под специфические задачи и интегрировать в любую экосистему — будь то CRM, ERP или внутренняя сеть. Такая интеграция обеспечит не только оптимизацию труда, но и позволит обезопасить данные.
Алгоритмы распознавания созданы командой ML ООО «ПРАЙ» при участии профессорского и кандидатского состава математиков КубГУ.