Перейти к содержимому

Распознать области

картинка_0

Описание

Блок позволяет распознать документ. Угол перекоса входного изображения не более 45%. Для этого необходимо указать путь к файлу, OAuth-токен Yandex, идентификатор каталога Yandex, путь к файлу для сохранения результата распознавания.

Также блок имеет 2 выпадающих меню. Клик по символу раскрывающегося списка открывает следующее меню:

  • Распознать
    • области для распознавания;
    • ключевые слова.
  • Языковая модель
    • RU;
    • ENG;
    • RUS+ENG.

Подробная инструкция по регистрации в Яндекс Vision: Регистрация в Яндекс Vision.


Пример использования

В данном примере распознаются данные из двух счетов на оплату по ключевым словам (якорям):

  1. Определяются пути ко всем файлам, которые будут распознаваться, в указанной папке;
  2. Cоздается пустой список для записи результатов распознавания;
  3. Цикл, внутри которого выполняется распознавание каждого файла. Чтобы распознать данные между определенными словами, требуется указать эти данные в виде списка из двух элементов. В данном случае это: “Поставщик:” и “Покупатель:”, таким образом все данные, которые будут распознаны после слова “Поставщик:” до слова “Покупатель:”, будут извлечены. Если указать слово в формате строки, то будет распознана вся строка до конца после этого слова, в данном примере это “Счет на оплату”. После распознавания результаты будут добавлены в список “result”;
  4. Вывод на экран переменной “result”.
картинка_1

Результат

Вывод на экран результата распознавания:

картинка_4