Перейти к содержимому

Распознать документ

image_1

Описание

Блок распознает структурированные документы и возвращает результат в формате словаря.

Поддерживаются типы документов:

  • Паспорт РФ (основной разворот);
  • Водительское удостоверение (лицевая и обратная стороны);
  • Свидетельство о регистрации ТС (лицевая и обратная стороны).

Описание параметров

Блок имеет ряд параметров:

  1. Тип документа — шаблон распознавания целевого документа;

    Тип данных: str (Строка)

    Пример: Паспорт РФ (основной разворот)

  2. Файл документа — путь к файлу изображения или PDF для распознавания;

    Тип данных: str (Строка)

    Пример: C:\docs\passport.png

  3. OAuth-токен Yandex — токен доступа к Yandex Vision;

    Тип данных: str (Строка)

    Пример: y0_AQAAAA...

  4. Идентификатор каталога Yandex — ID каталога в Yandex Cloud;

    Тип данных: str (Строка)

    Пример: b1gxxxxxxxxxxxxx

  5. Языковая модель — язык распознавания:

    • RUS - блок распознаёт и обрабатывает текст только на русском языке;
    • ENG - блок распознаёт и обрабатывает текст только на английском языке.;
    • RUS+ENG - блок работает в многоязычном режиме: автоматически определяет язык каждого фрагмента текста (русский или английский) и применяет соответствующую языковую модель для его обработки.
image_2

Возвращаемое значение

Словарь с результатом распознавания:

Тип данных: dict (Словарь)

Пример: {"fields": {"name": "Иванов Иван"}}


Пример использования

В данном примере распознается основной разворот паспорта.

image_3