Перейти к содержимому

Распознать УПД

image_1

Описание

Блок распознает таблицы из универсального передаточного документа (УПД) и сохраняет результат в Excel-файл.


Описание параметров

Блок имеет ряд параметров:

  1. Файл документа — путь к входному файлу;

    Тип данных: str (Строка)

    Пример: C:\docs\upd.pdf

  2. Путь к Excel-файлу — путь к файлу для сохранения распознанных таблиц;

    Тип данных: str (Строка)

    Пример: C:\docs\upd_result.xlsx

  3. Коррекция перекоса изображения — включение выравнивания входного изображения;

    Тип данных: checkbox (Чекбокс)

    Пример:

  4. Языковая модель — язык распознавания:

    • RUS - блок распознаёт и обрабатывает текст только на русском языке;
    • ENG - блок распознаёт и обрабатывает текст только на английском языке.;
    • RUS+ENG - блок работает в многоязычном режиме: автоматически определяет язык каждого фрагмента текста (русский или английский) и применяет соответствующую языковую модель для его обработки.
  5. OAuth-токен Yandex — токен доступа к Yandex Vision;

    Тип данных: str (Строка)

    Пример: y0_AQAAAA...

  6. Идентификатор каталога Yandex — ID каталога в Yandex Cloud;

    Тип данных: str (Строка)

    Пример: b1gxxxxxxxxxxxxx


Возвращаемое значение

Словарь с результатом распознавания:

Тип данных: dict (Словарь)

Пример: {"tables": [...]}


Пример использования

В данном примере извлекается таблица из документа типа УПД.

image_2

Результат

Созданный Excel-файл с табличными данными:

image_3