Скрипт AutoIt для Djvu

Скрипт пакетного распознавания Ocrdjvu (домашняя страница). Требует для своей работы дополнительные файлы и AutoIt. Часть информации можно посмотреть в статье про скрипт PDF.

Требуемые файлы, указанные в комментарии, взял из дистрибутива DjvuOCR v.2.3 и сохранил вместе со скриптом:

DjvuOCRkomplekt.zip

Скрипт не показал себя хорошо в работе. Вот ссылка на описание DjvuOCR
в связке с дополнительными программами автоматизации.

На момент написания этой статьи провел один тест скрипта с 10 файлами DJVU в задании. В результате произошел сбой, описание которого ниже. В конечном результате оказались распознаны следующие файлы:

В скобках количество страниц, справа имя файла.


Эти файлы остались без распознавания:

То есть больше половины


Вот скриншоты сбоя. Свободного места на диске 6 Гб. Вероятно нужно поиграться с настройками операционной системы. Возможно внесла лепту программа виртуализации (защиты системы от нежелательных изменений) Shadow User.


А теперь о том, как работать со скриптом. После запуска он образует файл .tif:

Этот файл хотя в проводнике может быть виден нулевой размер, на самом деле в работе и размер в нем увеличивается. Через некоторое время запускается Finereader, потом закрывается. И таким образом работа делее идет сериями через файл .tif и Finereader.

Можно сочетанием клавиш Ctrl, Alt, Del запустить Диспетер задач. В трее появится иконка:

При активности процессора по изменяющемуся рисунку на иконке будет видно, что работа идет, когда Finereader не запущен.

Бывало, что работа прерывалась. Для продолжения в одном случае закрыл пакет и Finereader вручную.

С другого случая сохранил такой скриншот:

В распознанных файлах не нашел какие нибудь особенности страницы 184. Закрыл окно и программу и работа продолжилась.

К оглавлению