Считать текст из PDF файла
Описание
Блок считывает текстовое содержимое PDF-файла. Дополнительно можно включить удаление повторяющихся водяных знаков из результата.
Описание параметров
Блок имеет несколько параметров:
- Путь к файлу PDF — путь к исходному PDF-файлу.
Тип данных:
str (Строка)Пример:
C:\Users\User\Desktop\document.pdf - Удалить водяные знаки — удаление повторяющихся водяных знаков из извлеченного текста.
Тип данных:
checkbox (Чекбокс)Пример:
Истина
Возвращаемое значение
Тип данных: str (Строка)
Пример: Строка с извлечённым текстом из документа.
Пример использования
Блок считывает содержимое PDF файла с текстовым слоем.
Результат
Вывод результата на экран: