Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1 [?],  Часть 2 [?]
Scan Tailor


Задача программы - автоматизированная пост-обработка сырых сканов типовых книг (ЧБ текст + прямоугольные иллюстрации) для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса, что сильно ускоряет обработку типового материала  (ЧБ текст + прямоугольные иллюстрации). Для нетипового материала следует использовать СканКромсатор [?], PhotoShop [?], или GIMP [?].
ST, изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода [?]

"Описание порогов от AlVaKo" [?]
"Дополнение к описание порогов в контексте ST от звездочёта" [?]

Автор проекта - Tulon. Почему его здесь не видно? [?] .
DikBSD автор ветки ScanTailor Plus история повторяется [?].
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения [?]
 
попытка обозреть историю разработки и форков программы Scan Tailor (livejournal, 20 февраля 2025).
Статья об Scan Tailor в Герои России.

Всего записей: 39366 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 22:11 20-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
сырой скан, обработанный скан

Так какого лешего размеры не совпадают? Как сличать?
 

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 16:44 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тут результат 2-методов. Это не СТ.
 
https://transfiles.ru/0ef1n
 
Никакой пред и пост обработки. Только адаптивная бинаризация. Без подбора параметров.
 
Да, размер ч/б(не мой)  и исходного скана не совпадают.

Всего записей: 59 | Зарегистр. 06-07-2011 | Отправлено: 16:49 06-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Как сличать?

я вообще не врубаюсь, вы зачем мне эти вопросы задаёте. Я предоставил daa2013 материал. Чтобы он уважаемым людям, попросившим его дать пример сравнения, что-то показал. А с вами мне общаться мало смысла. Ткнул же носом что вы не дали версию проги и настроек. То есть базовое неуважение в переговорах. Нафиг мне в это влипать. Всё закончится "зато размер меньше! и вообще полная херня это вот всё!". Первый раз что ли.
Все существенные моменты я описал, буде кто захочет лично поразбираться без daa.

Всего записей: 3502 | Зарегистр. 15-07-2010 | Отправлено: 16:51 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если будет ч/б результат из СК и СТ одинакового размера, выложу изображение показывающее различие между двумя результатами.

Всего записей: 59 | Зарегистр. 06-07-2011 | Отправлено: 16:59 06-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
Я предоставил daa2013 материал.

Как и ожидалось: "Не ошибается тот, кто ни шиша не делает". ))
 

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 16:59 06-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
AlVaKo
Никакой пред и пост обработки. Только адаптивная бинаризация. Без подбора параметров.

ух. по мне так это лучше чем в СК бинаризовано. Фотошоп небось, со скриптами от Astra55 ?

Всего записей: 3502 | Зарегистр. 15-07-2010 | Отправлено: 17:02 06-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo say:

Цитата:
 одинакового размера

 
STEX: порог "EdgeDiv", ws:15, coef: 0.75:
 
1) branch: main:

 
2) branch: gaussblur:

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 17:05 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Последний раз фотошопу я видел в прошлом тысячилетии.

Всего записей: 59 | Зарегистр. 06-07-2011 | Отправлено: 17:08 06-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
AlVaKo
одинакового размера

так? убрал дескью, деспекл, резаки.
https://disk.yandex.ru/i/BUremvAGYQB7lw

Всего записей: 3502 | Зарегистр. 15-07-2010 | Отправлено: 17:20 06-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
убрал дескью, деспекл, резаки.

 
Так же отключил все плюшки, только порог "EdgeDiv", ws:15, coef:0.75:


Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 17:28 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тут разница между SK и ST
 
https://transfiles.ru/0pdzz
 
совпадения белых точек обозначается белым цветом,
совпадения черных точек обозначается темно-серым цветом
несовпадение обозначается синим/красным цветом
 
синий  - значит у ST белый пиксел
красный - значит у SK белый пиксел

Всего записей: 59 | Зарегистр. 06-07-2011 | Отправлено: 17:47 06-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo
я взял крупно последнюю букву "я", снизу-справа. Что-то не получается так как вы описываете.
 
посмотрите на нижнюю подошву справа. и на верх тоже справа.
либо я туплю.
 

 
upd
а, понял. не тот файл брал.

Всего записей: 3502 | Зарегистр. 15-07-2010 | Отправлено: 17:57 06-07-2024 | Исправлено: TelecomUral, 18:08 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У нас разные ч/б изображения. По старой ссылке добавил ч/б результаты какие у меня вышли после всех перетрубаций со скачиванием.

Всего записей: 59 | Зарегистр. 06-07-2011 | Отправлено: 18:09 06-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo say:

Цитата:
Тут разница между

Вопрос есть, можно сказать "на засыпку". Есть целый набор метрик, которые можно использовать для более-менее адекватного оценивания порогов: NRM, MPM, DRD. Но что "это" и где "это"? Ни теории не нашёл, ни инструмента.
 
PS: Упоминание этих метрик я увидел в Bolan Su, Shijian Lu Member, IEEE, Chew Lim Tan Senior Member, IEEE "A Robust Document Image Binarization Technique for Degraded Document Images".

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 18:31 06-07-2024 | Исправлено: zvezdochiot, 18:57 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вы это полегче, у меня математика на уровне церковно-приходской школы.
 
Насколько я понял, читая всякие статейки о бинаризации, из исходного скана готовят вручную "базовую истину", то что представляется "идеалом" для измеряльщика. Ну а потом сравнивают реальный результат с "истиной".    
 
Тут pdf-ка и картинки с выставки конкурса по бинаризации
DIBCO 2009: document image binarization contest
https://transfiles.ru/o39f4
 
какое-то описание методики измерения/оценки результатов работы методов бинаризации, участвовавших в соревновании.

Всего записей: 59 | Зарегистр. 06-07-2011 | Отправлено: 18:57 06-07-2024 | Исправлено: AlVaKo, 18:58 06-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo say:

Цитата:
DIBCO 2009: document image binarization contest
https://transfiles.ru/o39f4

Премного. Не хватает только самой интересной: DRD. Но и без неё уже есть с чем "поковыряться". Спсб.
 

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 19:02 06-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вариант после преобразования:
jpg (DjVu Small Mod) > DjVu ("без потерь)" > tiff

Всего записей: 561 | Зарегистр. 22-06-2016 | Отправлено: 19:15 06-07-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Их несколько было этих соревнований, в разные годы. Искать по словам ICDAR  или DIBCO. В 2009 первый такой конкурс. В последующих может и есть описание иных метрик.  

Всего записей: 59 | Зарегистр. 06-07-2011 | Отправлено: 19:17 06-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo say:

Цитата:
Их несколько было...

Ну так то всё понятно в этих метриках: производится сравнение с неким образцом GT. Только вот сам этот образец GT (Ground truth) как в тумане. Никто не пишет толком, откуда ноги растут. И числовые значения метрик не очень то вразумительные. А вот метрика DRD в плане числовых значений гораздо интересней. Это всего лишь догадка, но более чем возможно, что в ней путём того же сравнения формируется некая матрица (как вариант ковариционная или близкая к ней), после чего рассчитывается число обусловленности ("плохости") этой матрицы. А вот такие числа и их значения мне уже очень даже понятны. Такие вот дела.

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 19:32 06-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Скриншоты слева направо:
ScanTailor-0.9.11.1-64bit
Scan Tailor experimental 2016-02-22 by Tulon
Scan Tailor Universal 0.2.14 by trufanov-nok
scantailor-experimental-0.2024.05.18-Win32-X86-64-Qt6
ScanTailor-Advanced-1.0.19 [x64]
СК - 7.00 на Auto. без зон и Quality. от TelecomUral
 
Все СканТейлоры - (почти) тупо нажимались подряд все кнопки Play, поворот не выполнялся, контент в максимум, поля в 0, бинаризация Otsu, ползунок 0, всё остальное по умолчанию.
 
Набор скриншотов №1

 - 1-я строка, слово "увеличение, 1-я буква "е". Лично мне ясно виден характерный всплеск размером в 2-3 пикселя сверху буквы "е". Именно этот всплеск бросается в глаза при обычном просмотре на обычном масштабе. Также щербатый верх перекладины. И так на очень многих буквах.
 
Набор скриншотов №2

 - лично мне ясно видно утолщение справа в 1 пиксель на верхнем кольце (знак градуса). Именно это утолщение контура бросается в глаза при обычном просмотре на обычном масштабе. Также и на верхнем и на нижнем кольце лично мне ясно видна гребёнка в 1 пиксель. Ну вы поняли. И вот такая гребёнка на очень многих буквах. Куча букв выглядит щербатыми.

Всего записей: 946 | Зарегистр. 04-11-2019 | Отправлено: 19:35 06-07-2024 | Исправлено: jourmager, 20:34 06-07-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru