Распознать УПД
Описание
Блок распознает таблицы из универсального передаточного документа (УПД) и сохраняет результат в Excel-файл.
Описание параметров
Блок имеет ряд параметров:
-
Файл документа — путь к входному файлу;
Тип данных:
str (Строка)Пример:
C:\docs\upd.pdf -
Путь к Excel-файлу — путь к файлу для сохранения распознанных таблиц;
Тип данных:
str (Строка)Пример:
C:\docs\upd_result.xlsx -
Коррекция перекоса изображения — включение выравнивания входного изображения;
Тип данных:
checkbox (Чекбокс)Пример:
✔ -
Языковая модель — язык распознавания:
- RUS - блок распознаёт и обрабатывает текст только на русском языке;
- ENG - блок распознаёт и обрабатывает текст только на английском языке.;
- RUS+ENG - блок работает в многоязычном режиме: автоматически определяет язык каждого фрагмента текста (русский или английский) и применяет соответствующую языковую модель для его обработки.
-
OAuth-токен Yandex — токен доступа к Yandex Vision;
Тип данных:
str (Строка)Пример:
y0_AQAAAA... -
Идентификатор каталога Yandex — ID каталога в Yandex Cloud;
Тип данных:
str (Строка)Пример:
b1gxxxxxxxxxxxxx
Возвращаемое значение
Словарь с результатом распознавания:
Тип данных: dict (Словарь)
Пример: {"tables": [...]}
Пример использования
В данном примере извлекается таблица из документа типа УПД.
Результат
Созданный Excel-файл с табличными данными: