Выбрать области для распознавания
Описание
Блок предназначен для выбора областей документа с целью последующего OCR-распознавания. Также он позволяет сохранить выделенные области в JSON-файл для их дальнейшего повторного использования.
Описание параметров
Блок имеет несколько параметров:
-
Путь к файлу (PDF, JPG, PNG) — путь к файлу для выбора областей;
Тип данных:
str (Строка)Пример:
C:\docs\invoice.jpg -
Сохранить области в JSON-файл — путь к файлу для сохранения областей;
Тип данных:
str (Строка)Пример:
C:\docs\invoice.json -
Области для Tesseract OCR — чекбокс для отбора областей для Tesseract OCR;
Тип данных:
checkbox (Чекбокс)Пример:
✔ -
Коррекция перекоса изображения — включение выравнивания входного изображения;
Тип данных:
checkbox (Чекбокс)Пример:
✔
Пример использования
В данном примере выбираются области для распознавания PDF-файлов, после чего выполняется пакетная обработка документов.
- В блоке выбирается режим сохранения областей в переменную
areas. - В открывшемся окне курсором выделяются области для распознавания.
- После завершения выделения окно закрывается.
- Выполняется распознавание набора файлов по сохраненному шаблону областей.
Результат
Вывод распознанных данных: