Ganome/DOT-Files

ganome 38a03701d2

Automated updated process of shell scripts and DOT Files (gentooamd)

2026-06-12 17:51:25 -06:00

1.3 KiB

Raw Blame History

tesseract

Движок оптического распознавания символов (OCR). Больше информации: https://github.com/tesseract-ocr/tesseract/blob/main/doc/tesseract.1.asc.

Распознать текст на изображении и сохранить его по указанному пути (расширение .txt добавляется автоматически):

tesseract {{путь/к/изображению.png}} {{путь/к/выходному_файлу}}

Указать язык ([l]anguage) (по умолчанию английский), используя код ISO 639-2 (например, deu = Deutsch = Немецкий):

tesseract -l deu {{путь/к/изображению.png}} {{путь/к/выходному_файлу}}

Вывести список кодов ISO 639-2 установленных языков:

tesseract --list-langs

Указать режим сегментации страницы ([p]age [s]egmentation [m]ode) (по умолчанию 3):

tesseract --psm {{0..13}} {{путь/к/изображению.png}} {{путь/к/выходному_файлу}}

Вывести список режимов сегментации страниц и их описания:

tesseract --help-psm