BigSun
Junior Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Цитата: Сейчас постараюсь оперативно сделать два разных режима - без пауз (если нет проблемы с зависанием) и safe (с отдельным процессом и убиванием). Тогда можно будет выбрать. | Как и обещал сейчас поправил bat файлы - введен режим работы. В обычном режиме утилиты imagemagick вызываются внутри общего процесса, поэтому скорость высокая. В self режиме утилиты imagemagick вызываются через команду start отдельным процессом, делается пауза в 2 сек., а потом процесс убивается. Эти 2 сек. делают процесс медленным. 2 сек. по моим замерам достаточно чтобы выполнить операцию. Если convert зависнет, то он будет убит через 2 сек. В обычном режиме если зависнет convert, то процесс будет висеть вес и USD ничего не делает, так как не получил ответа. Если у вас нет проблем с зависанием convert, то установите work-mode=0 Обновление возьмите здесь. https://cloud.mail.ru/public/4mMr/4QmahoPL7 В обновлении два bat файла которые нужно заменить. Это для всех сборок. В комментариях файлов описаны режимы. Всю ночь работы - без проблем. Добавлено: AnGo Цитата: Попробуем новую. Спасибо большое за труды! | Рад что программа помогает. В новой версии полностью изменены фильтры предварительной обработки картинок. Обработал 1600 картинок, результат 33% - идеальны для OCR, 33% - "не дожарены" остался мусор, 33% - "пережарены" символы частично разрушены (А или Н - не имеют горизонтальных палок), 1% - один символ вообще исчез. Можно "убавить" фильтры, или "прибавить", но в общем мы получим 33% отличных картинок, которые пригодны для Tesseract. Получается как в анекдоте - автоматический станок для бритья, после первого бритья все лица одинаковые. Я сам устанавливаю режим IN1 - оптимально по скорости и вероятности распознавания символов. |