Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1,  Часть 2
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
ST, изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода

"Описание порогов от AlVaKo"
"Дополнение к описание порогов в контексте ST от звездочёта"

Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения
 
попытка обозреть историю разработки и форков программы Scan Tailor (livejournal, 19 августа 2024).

Всего записей: 39117 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 16:51 18-09-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
А вот метрика DRD в плане числовых значений гораздо интересней.

 
вот какая-та похожая фигня
Haiping Lu. Distance-Reciprocal Distortion Measure for Binary Document Images.

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 20:06 06-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Некоторые итоги.  
1) По моим наблюдениям бинаризированный текст от СканКромсатора выглядит хуже, чем бинаризированный текст от любого из СканТейлоров. Выглядит СК хуже чем СТ по причине наличия непредсказуемых лишних пикселей, которые или добавляют толщину, или добавляют щербатость. Но это верно для этого конкретного скана. На другом скане всё может быть иначе.  
2) 100%-ной повторяемости результата бинаризации нет ни на одном из СТ, ни у СК. Общая картина более-менее одинакова, но при каждом новом прогоне бинаризации может быть несовпадение размером в единичные пиксели.
3) данный файл i_0212_kusok_pejsahson75.jpg имеет 27052 уникальных цвета, т.е. в данном случае тестируется не только качество бинаризации, но и качество преобразования из RGB 24 бит в Grey 8 бит. Т.е. условия с одной стороны приближенные к реальным, с другой - эксперимент не является чистым.
4) практически единственным методом сравнения качества чего угодно, которое воспринимается человеческими органами чувств - это слепое двойное тестирование на обычных пользователях. На котором также можно получить дурацкие результаты. Если не думать.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 20:32 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Общая картина более-менее одинакова, но при каждом новом прогоне бинаризации может быть несовпадение размером в единичные пиксели.  

Там что? При бинаризации применяют метод Монте-Карло?

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 20:41 06-07-2024
indifirent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Del

Всего записей: 197 | Зарегистр. 02-06-2018 | Отправлено: 22:20 06-07-2024 | Исправлено: indifirent, 22:46 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Выглядит СК хуже чем СТ по причине наличия непредсказуемых лишних пикселей, которые или добавляют толщину, или добавляют щербатость.

В варианте СК от TelecomUral как я понял максимально выключены фильтры. А в вариантах из СТ видна работа "сглаживателей". Сегмент "дырки" у буквы "е" справа и слева замазаны черным, дуга прерывается вертикальной прямой. Т.е. это не совсем сравнение работы только "бинаризаторов".  
 

Цитата:
jourmager
Скриншоты слева направо:  
ScanTailor-0.9.11.1-64bit  
Scan Tailor experimental 2016-02-22 by Tulon  
Scan Tailor Universal 0.2.14 by trufanov-nok  
scantailor-experimental-0.2024.05.18-Win32-X86-64-Qt6  
ScanTailor-Advanced-1.0.19 [x64]  

 
Если выложите результаты в виде файлов, попробую сделалать попарные визуальные сравнения с СК. Лишь бы descew не было при обработке.

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 07:29 07-07-2024 | Исправлено: AlVaKo, 07:55 07-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
jourmager
не только качество бинаризации, но и качество преобразования из RGB 24 бит в Grey 8 бит

я в паре мест присмотрелся, похоже что да. влияет и метод перевода в gray. скан был сделан на оптикбуке 4800, у него желтый с синим расходятся (окантовки, их видно). так вот СК желтый канал  взял не так, как ST.

Всего записей: 3323 | Зарегистр. 15-07-2010 | Отправлено: 11:24 07-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
... не так, как ST.

Хватит сравнивать эти две совершенно разные системы. AAW, вернитесь в ветку SK и дайте клич по своей секте о сборе рецептов по сочетанию (комбо) фильтров. А когда наберётся достаточное кол-во комбо, попросите у bolega, чтобы он оформил их во что-нибудь быстровызываемое и быстроприменяемое. От этого и вам польза будет и нам меньше ваших неуместностей слушать.
 
Что такое комбо?
 
Порог Gatos - 'это комбо из порога Niblack и чистильщика Gatos.
Порог EdgeDiv - это комбо из префильтра EdgeDiv (последовательность EdgePlus и BlurDiv) и порога Otsu (либо оптимального порога).

Всего записей: 690 | Зарегистр. 18-05-2023 | Отправлено: 20:25 07-07-2024 | Исправлено: zvezdochiot, 20:29 07-07-2024
VSHY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Набор скриншотов №1

Как по мне, то тут победа ScanTailor-Advanced.

Всего записей: 1134 | Зарегистр. 19-05-2008 | Отправлено: 21:01 07-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
вернитесь в ветку SK ... нам меньше ваших неуместностей слушать  

а я что с самого начала сказал?

Цитата:
Всё закончится "зато размер меньше! и вообще полная херня это вот всё!"

песочница, она и есть.
При том, что я за три страницы слова плохого про обработку в ST не сказал, специально за языком следил. "не так" не означает "хуже". И пытался помочь разобраться в отличиях. Дети, они и есть дети.

Всего записей: 3323 | Зарегистр. 15-07-2010 | Отправлено: 23:04 07-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo

Цитата:
Если выложите результаты в виде файлов

Архив с 6 tif-файлами. 5 моих ST, 1 от TelecomUral СК 7.00 на Auto. без зон и Quality
Как я уже писал, все эти tif-файлы я получил в соответствующих версиях СТ без исправления наклона, зона контента на максимум, поля в 0, на 6-м этапе ничего не нажималось и всё оставалось по умолчанию, ползунок бинаризации на 0, метод бинаризации по умолчанию (Otsu). Файлы не выбирались, просто пять запусков разных СканТейлоров один за другим. Только на STE масштабирование принудительно переводилось из 2х в 1х.

Цитата:
в вариантах из СТ видна работа "сглаживателей"

Включаем режим отладки и наблюдаем на 6-м этапе 15-20 последовательных операций, включая последовательно normalized illumination, smoothed, binarized and cropped, edges smoothed, despeckled

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 23:26 07-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
метод бинаризации по умолчанию (Otsu).

А почему именно порог Otsu? Я в общей сложности год "алхимичил" над префильтром EdgeDiv к нему (несколько месяцев на BlurDiv, более полугода на проработку/переработку EdgePlus и немного на слияние). Даже в изначальном ST порог Otsu не применяется без префильтра "Выравнивание освещения".
 
PS: Необходимость префильтрации перед порогом в своих работах рассматривал даже Дональд Е. Кнут. При этом он совсем не Otsu использовал, а гораздо более хитрые техники.

Всего записей: 690 | Зарегистр. 18-05-2023 | Отправлено: 00:01 08-07-2024 | Исправлено: zvezdochiot, 00:12 08-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Разница между SK и ST(5 шт)  
 
https://transfiles.ru/e5lvh
 
совпадения белых точек обозначается белым цветом,  
совпадения черных точек обозначается темно-серым цветом  
несовпадение обозначается синим/красным цветом  
 
синий  - значит у ST белый пиксел или серый+синий=SK  
красный - значит у SK белый пиксел или серый+красный=ST

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 07:04 08-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По многочисленным пожеланиям скриншот-зрителей
Набор скриншотов №3

Меня попросили обратить внимание, например, на внутреннее соединение основного и соединительного штрихов у определённой буквы "у". Да, в моих примерах у STU там "ямка зализана в горизонталь". А у остальных СТ? Почему так получилось у STU можно долго гадать, а можно вообще плюнуть и растереть, потому что эта "зализанность в горизонталь" видно на скриншотах с увеличением в 300%, а при реальном чтении с экрана в реальном масштабе реальным пользователем дизайнерские изыски шрифтов не будут заметны, а будут заметны другие вещи. Обычный пользователь не разбирается в том, как должен выглядеть конкретный элемент буквы конкретного шрифта, но отлично понимает, что контуры букв должны быть гладкими без зазубрин (без щербатости) и толщина элементов букв должна быть логически одинаковой. Именно на это я обращал внимание при сравнении результатов бинаризации. Туда же слияние элементов букв, белые дырки в чёрных элементах букв и прочее.
Для истинных ценителей дизайна шрифтов в pdf есть возможность подставлять векторные шрифты, а для djvu есть ненулевая возможность криво-косые глифы заменять на образцовые в 1200 dpi, сделанные из соответствующих векторных шрифтов.
 
zvezdochiot

Цитата:
А почему именно порог Otsu?

Там не только порог Otsu, но ещё ползунок в ноль.
Потому что Otsu - это выбор по умолчанию, одинаковый для всех СканТейлоров. Т.е. при сравнении  все СТ и СК поставлены в одинаковые условия (простые нажатия далее -> далее -> далее) без ручной подгонки параметров.
 
Изначальная идеология СканТейлора заключалась в том, чтобы ручные телодвижения пользователя, которые он всё равно вынужден делать, переложить на автоматику программы и таким образом облегчить жизнь юзера. Tulon два года в оригинальном СканТейлоре постоянно допиливал алгоритм 6-го этапа - выравнивание освещенности, сглаживание, бинаризация, устранение щербатости (и ещё дюжину фильтров) - основываясь и на своих многочисленных опытах, и прислушиваясь к мнению сторонних пользователей. И эту работу он продолжил в STExp. В ранних версиях СТ были и Савуола и Волф, но Тулон пришёл к выводу, что комплексного применения фильтров плюс Отсу должно хватить для подавляющего большинства сканов. Также, по просьбам пользователей, был добавлен ползунок тоньше-толще.
 
И ещё. Сравнивать качество обработки в различных режимах и разными программами можно и нужно. Но с умом. Бесполезно сравнивать на одной отдельно взятой букве, если проблемы в этой букве единичны и не являются характерными вообще для всех букв на странице и на всех страницах книги. Именно поэтому ручная подгонка параметров затруднена.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 11:58 08-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
Изначальная идеология СканТейлора заключалась в том, чтобы ручные телодвижения пользователя, которые он всё равно вынужден делать, переложить на автоматику программы

Что значит изначальная? Это и есть идеалогия всех семейств ST и по сей день. Потому и игнорится большая часть запросов, так как в эту идеалогию никак не укладываются. Такие вот дела.
 

Всего записей: 690 | Зарегистр. 18-05-2023 | Отправлено: 15:15 08-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Не хватает только самой интересной: DRD

 
Здесь описание
https://users.iit.demokritos.gr/~bgat/H-DIBCO_2012.pdf

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 15:46 09-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo say:

Цитата:
Здесь описание

Достаточно мутное описание, но менее плохо чем ничего. Спсб.

Всего записей: 690 | Зарегистр. 18-05-2023 | Отправлено: 19:22 09-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
jourmager say:
Цитата:
Изначальная идеология СканТейлора заключалась в том, чтобы ручные телодвижения пользователя, которые он всё равно вынужден делать, переложить на автоматику программы
 
Что значит изначальная? Это и есть идеалогия всех семейств ST и по сей день. Потому и игнорится большая часть запросов, так как в эту идеалогию никак не укладываются. Такие вот дела.

Одна цитата:

Цитата:
 
Автор: 4lex4, Отправлено:22:36 26-02-2018
Лично моя задача - это не простой инструмент, а быстрый и автоматизированый, мне на сложность наплевать вообще.
Официальный СТ мне не подходит из-за недостатка возможностей для многих случаев и полной неуправляемости - жертва упрощения вообщем. Упрощение настолько сильное, что даже при всем желании опытный обработчик не сможет получить качественный результат для многих случаев из-за ограничений инструмента.
Для СТА это не так: для получения качественного результата СТА должен использоваться только в комбинации с граф. редактором, кроме разве что простых случаев, но это стоит того, ибо во многом быстрее и удобнее, да и процесс более контролируемый и позволяет автоматизировать некоторые части.
Единственная проблема - для СТА нет нормальных туторов, как пользоваться новыми фичами и получать качественный результат, используя СТА в комбинации граф. редакторами, и писать их кроме меня некому, и эту проблему я планирую решить после выхода СТА 1.1.x, через месяц-два. Правда каждый может и сейчас прочитать README на гитхабе, я там обычно описываю детали этих фич, и додумать как их юзать самому, ибо на самом деле ничего особо сложного нет, если есть опыт использования граф. редакторов.
 

 
и пять скриншотов в одном

 

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 23:32 09-07-2024 | Исправлено: jourmager, 23:34 09-07-2024
VSHY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
и пять скриншотов в одном
Круто!
 
Можно было сделать все настройки - ST-0.9, STE-2024 и STA в одной проге. В настройках выбрать режим работы с интерфейсом, и открывался бы установленный. Типа "Expert mode" соответствовал бы STE-2024. Это всё примерно конечно, но идея смогла бы сработать, если бы работа всех остальных стадий была бы унифицирована.

Всего записей: 1134 | Зарегистр. 19-05-2008 | Отправлено: 13:19 10-07-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
и пять скриншотов в одном  

 
Для STU  скриншот не совсем точный. Там внутри меню Settings   для стадии Output ещё штук 12 параметров сидит.
 

Всего записей: 1044 | Зарегистр. 13-06-2013 | Отправлено: 15:08 10-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Для STU  скриншот не совсем точный. Там внутри меню Settings   для стадии Output ещё штук 12 параметров сидит.

Да. А внутри сидит Black & White mode, в которой есть единственный параметр Disable smoothing, который по умолчанию отключен.
Кстати, в STA на стадии Output есть три чекбокса - Equalize Illumination (B&W), Savitzky-Goley Smoothing, Morphological Smoothing, включенных по умолчанию.
А теперь вопрос на засыпку - что будет с "ямкой зализанной в горизонталь", если лёгким тыцком мышкой включить чекбокс в STU, или повыключать чекбоксы в STA? Нужны скриншоты? Для STU это просто 2 штуки, а для STA надо 8 штук. Как вы все догадываетесь, я результаты таких вкл-выкл уже видел.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 15:58 10-07-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru