Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1 [?],  Часть 2 [?]
Scan Tailor


Задача программы - автоматизированная пост-обработка сырых сканов типовых книг (ЧБ текст + прямоугольные иллюстрации) для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса, что сильно ускоряет обработку типового материала  (ЧБ текст + прямоугольные иллюстрации). Для нетипового материала следует использовать СканКромсатор [?], PhotoShop [?], или GIMP [?].
ST, изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода [?]

"Описание порогов от AlVaKo" [?]
"Дополнение к описание порогов в контексте ST от звездочёта" [?]

Автор проекта - Tulon. Почему его здесь не видно? [?] .
DikBSD автор ветки ScanTailor Plus история повторяется [?].
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения [?]
 
попытка обозреть историю разработки и форков программы Scan Tailor (livejournal, 20 февраля 2025).
Статья об Scan Tailor в Герои России.

Всего записей: 39366 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 22:11 20-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MZN say:

Цитата:
Сканировать надо нормально и этого не понадобится  

Уже есть такой персонаж, который пяткой себя бил в грудь, а на деле... видим фигу... [?]

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 19:54 23-07-2024 | Исправлено: zvezdochiot, 19:54 23-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
а на деле... видим фигу...  

вы не забывайте тамошний мой ответ процитировать: не для вас сканировалось.

Всего записей: 3502 | Зарегистр. 15-07-2010 | Отправлено: 20:07 23-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:

Цитата:
вы не забывайте

А нефига флудить здесь! (я про те самые страницы с вашими испражнениями).
 
 





Нарушение п. 2.16. главы VIII Соглашения по использованию
+ грубые выражения

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 20:09 23-07-2024 | Исправлено: Maz, 21:21 23-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Не вроде, а работает. И правильно работает, причём только в этом семействе ST.

А вы бы не могли продемонстрировать исправление геометрии в STEX на  
вот этих файлах?

Всего записей: 946 | Зарегистр. 04-11-2019 | Отправлено: 20:38 23-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:

Цитата:
А вы бы не могли...

А смысл? Это не сканы, а сплошное мыло (до 50%). Что вы с "этим" дальше будете делать после исправления искажений? Блюр - самый поганный вид искажения из всего набора искажений по всем "слепым" тестам, а переменный блюр так вообще не поддаётся коррекции и рихтовке. Такие вот дела.

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 21:04 23-07-2024 | Исправлено: zvezdochiot, 21:04 23-07-2024
MZN

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
Вы поаккуратнее с TelecomUral он сразу стучит модераторам.
На самом деле, книжный сканер практически не дает искажений, или Вы про такой не слыхали?

Всего записей: 1804 | Зарегистр. 23-10-2004 | Отправлено: 22:00 23-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MZN say:

Цитата:
книжный сканер практически не дает искажений

Я знаю. А ещё есть OpticBook. Вот только у большинства ни того, ни другого. Поэтому большинству исправления искажений нужны.
 
PS: Про трёхбуквенного персонажа не беспокойтесь, мы с ним уже порядочно "дружим", и, что за субстанцию он из себя представляет, я прекрасно знаю.

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 22:19 23-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
А смысл?

? Повторю ещё раз:

Цитата:
продемонстрировать исправление геометрии в STEX

 
MZN

Цитата:
он сразу стучит модераторам

Не понял. По-вашему на ру-борде надо допускать варез в неварезных темах, дубли, мат, оскорбления, оффтоп, переход на личности, рекламу, спам, флуд? Или вы сомневаетесь в профессиональных качествах модераторов?
 
zvezdochiot

Цитата:
книжный сканер практически не дает искажений
Я знаю. А ещё есть OpticBook. Вот только у большинства ни того, ни другого.  

Фейспалм. OpticBook и есть специализированный книжный планшетный сканер. Слово "book" в его названии ничего не говорит? Даю подсказку, по-английски слово "book" значит "книга". Пруфы нужны?
И да, про планетарные сканеры во всех их разновидностях я знаю.

Всего записей: 946 | Зарегистр. 04-11-2019 | Отправлено: 09:29 24-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
А ещё есть OpticBook. Вот только у большинства ни того, ни другого. Поэтому большинству исправления искажений нужны.

ну вам же выше показал jourmager, что получается с книгой, если у сканировщика "ни того, ни другого". Говенные фотосканы получаются.  
Ну должна же быть ну хоть какая-то логическая взаимоувязка предметной области в голове. Подробнее... [?]
Правильный ответ не "нужна исправлялка искажений", а либо приобретение сканера, либо просьба к тем у кого он есть.

Всего записей: 3502 | Зарегистр. 15-07-2010 | Отправлено: 11:36 24-07-2024 | Исправлено: TelecomUral, 11:51 24-07-2024
MZN

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager
Почитайте персонаж - поймете. Он простой манипулятор. Из последних его высказываний: не нужны pdf и исправлялка искажений. Очень боится, что любимый СК даже пенсионеры забудут. Большая часть писаний - камлания и мутный поток сознания и пустое многословие.





переход на личности

Всего записей: 1804 | Зарегистр. 23-10-2004 | Отправлено: 14:47 24-07-2024 | Исправлено: Maz, 00:42 25-07-2024
VSHY

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Правильный ответ не "нужна исправлялка искажений", а либо приобретение сканера, либо просьба к тем у кого он есть.
Не всегда есть возможность отсканить самому, потому берутся те сканы, которые есть в сети или дали.
 
Оно есть и не мешает. А иногда может помочь.
Если мешает, то если кто-то будет продолжать  разработку, то можно было бы в настройках отметить, стадии галочками, которые нужны, либо отключить ненужные. И отключённые просто скрывать.

Всего записей: 1159 | Зарегистр. 19-05-2008 | Отправлено: 18:59 24-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемые форумчане.
 
"Как верёвочке не вейся...", а снова я возвращаюсь к блюру. Опять! И никак не обойти эту тему. А материал jourmager лишь напомнил, что "от судьбы не уйдёшь".
 
Палка о двух концах: с одной стороны вся обработка базируется на фильтре именно с эффектом размытия, с другой стороны размытие на самом исходном скане резко ухудшает результат любой обработки.
 
Попробовал опять применить deblur (ну вдруг прокатит) в глобальном и тайловом вариантах. Не прокатило. Ядро размытия не определяется: в глобальном варианте - из-за переменности размытия, в тайловом варианте - из-за малого (недостаточного) размера тайлов.
 
Провёл тест по оконтуриванию буков доступными на данный момент средствами - применил целую серию порогов с параметрами из своего опыта при двух уровнях "Выравнивания освещения": 0.00 и 1.00.
 
Наименее плохими (ИМХО) показали себя пороги Grad и EdgeDiv при окне 15 и коэффициенте 0.75:

Но! Этого недостаточно для восстановления начертания буков до нужного качества! Нужен ещё более устойчивый к размытию порог.
 
Ежели у кого имеются мысли или рецепты (неважно в какой программе, было б лишь хоть какое то описание и илюстрирование процесса) непременно делитесь. Эта тема долгая, нудная, но очень важная.
 
PS: Использовал материал jourmager в тесте, потому что мой материал в "этой" области ещё хуже (помимо переменного размытия, ещё и переменная освещённость) и результат на нём совсем безнадёжен.

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 19:37 24-07-2024 | Исправлено: zvezdochiot, 19:46 24-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я такое делаю серым.
Тут распознавание напрашивается. Если уж не букв, то их составных частей графического отображения (отрезки, дуги и др.).

Всего записей: 561 | Зарегистр. 22-06-2016 | Отправлено: 20:46 24-07-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:

Цитата:
Я такое делаю серым.  

Это никак не помогает восстановить контур буков. Уточню: для восстановления мне достаточно маски (результата порога), как её использовать я знаю и знаю очень хорошо. Проблема именно в маске. Как получить маску необходимого качества, несмотря на столь отвратительное размытие исходника?
 

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 20:56 24-07-2024
snch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день! Вопрос несколько не про работу программы как таковой, но связан с обработкой изображений с текстом. Тут, как я знаю, присутствуют люди, понимающие в этом дай боже! Нужные страницы из книг мне, к сожалению, удалось получить только фотографируя их телефоном с монитора в читальном зале библиотеки, поэтому качество — нечто среднее между плохим и ужасным.
 
Примеры: https://disk.yandex.ru/d/hvWjX43abpNKXA
 
Подскажите, пожалуйста, можно ли отделить текст от фона до сколько-нибудь приемлемого уровня (про хорошую бинаризацию со сглаживанием и не заикаюсь), чтобы в дальнейшем распознать его в Finereader'е? Моих познаний в Photoshop не хватает. Заранее спасибо!

Всего записей: 85 | Зарегистр. 11-08-2006 | Отправлено: 13:39 04-09-2024 | Исправлено: snch, 15:26 04-09-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
snch say:

Цитата:
 можно ли как-то отделить текст от фона до сколько-нибудь приемлемого уровня

 
STEX последнего релиза: book-20240904.zip
 
При открытии проекта выскочат ошибки путей к файлам. Исправьте их в "Инструменты" -> "Пути в проекте...".

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 15:11 04-09-2024
snch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
2zvezdochiot
 
Фантастиш, спасибо!

Всего записей: 85 | Зарегистр. 11-08-2006 | Отправлено: 16:11 04-09-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
snch
а что за книжка? БСЭ-3, информационный взрыв...

Всего записей: 3502 | Зарегистр. 15-07-2010 | Отправлено: 17:39 04-09-2024
snch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
2TelecomUral
 
Это страницы разных статей по теме энциклопедического дела из ранних выпусков отличного, очень любопытного не только для профессионалов, но и просто для интересующихся историей книжного дела сборника "Книга. Исследования и материалы", изданного в 117 выпусках в 1959—2019 годах (плюс в 2017—2022 годах вышло еще 6 электронных). В электронной библиотеке РГБ имеются все их сканы, однако прочесть их, увы, можно только с экрана монитора непосредственно в библиотеке (районной в моем случае). Перечень выпусков с содержанием: https://www.elibrary.ru/title_about.asp?id=26841

Всего записей: 85 | Зарегистр. 11-08-2006 | Отправлено: 11:11 06-09-2024 | Исправлено: snch, 11:12 06-09-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп [?]

Всего записей: 3502 | Зарегистр. 15-07-2010 | Отправлено: 13:23 06-09-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru