Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1 [?],  Часть 2 [?]
Scan Tailor


Задача программы - автоматизированная пост-обработка сырых сканов типовых книг (ЧБ текст + прямоугольные иллюстрации) для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса, что сильно ускоряет обработку типового материала  (ЧБ текст + прямоугольные иллюстрации). Для нетипового материала следует использовать СканКромсатор [?], PhotoShop [?], или GIMP [?].
ST, изначально не позиционировался как единственный инструмент обработки и применяется в комплексе с другими программами.
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Experimental (мод. звездочёта, Нубия-IV и plzombie) >>>  последняя версия
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода [?]

"Описание порогов от AlVaKo" [?]
"Дополнение к описание порогов в контексте ST от звездочёта" [?]

Автор проекта - Tulon. Почему его здесь не видно? [?] .
DikBSD автор ветки ScanTailor Plus история повторяется [?].
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения [?]
 
попытка обозреть историю разработки и форков программы Scan Tailor (livejournal, 20 февраля 2025).
Статья об Scan Tailor в Герои России.

Всего записей: 39343 | Зарегистр. 26-02-2002 | Отправлено: 10:44 10-01-2024 | Исправлено: zvezdochiot, 22:11 20-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
Моё утверждение, что "введение дополнительных фильтров и порогов не имеет практической пользы" действительно некорректно из-за своей огульности.  

Не "некоректно". Это называется по другому. Но для форумов употреблять запрещено.
 
jourmager say:
Цитата:
введение дополнительных фильтров и порогов, сделанные zvezdochiot и Ко в STEX не имеет практической пользы

"Забыли" ИМХО поставить. "Забыли" как тестируются фильтры. И "забыли" уточнить, что вы этими фильтрами не пользовались от слова "совсем".
 
jourmager say:
Цитата:
Поэтому внедрение Sauvola, Wolf, и, может быть, некоторых других порогов, типа Gatos например, имеет практический смысл.

Но мы так и не услышали параметры вашего Wolf. По той же самой логике он также не имеет смысла.
 
jourmager say:
Цитата:
Еще раз - порог Вольфа сделан на основе данных по бинаризации 371 изображения с 10 символами на каждом в среднем.

А так же вам известно, что Вольф является модификацией Сауволы, а предтечей для них обоих - Ниблэк. И также вам известно, что на Вольфе  статистические характеристики исчерпаны. Нету больше. И "это" вам очень известно. Но вы поскромничали? Чем развивать то собираемся?

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 01:18 07-03-2025 | Исправлено: zvezdochiot, 01:48 07-03-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Но мы так и не услышали параметры вашего Wolf.

Угу. Вообще-то нормального результата бинаризации я добился в ST Advanced на Вольфе буквально 2-3 телодвижениями.  
 
Но у меня была другая задача. Не сделать хорошо. А сделать одинаково с вашим результатом бинаризации в STEX на Grad/Balance. Я задолбался вертеть 18 крутилок в STEX подгоняя результат. Ведь я делал бинаризацию в 3 режимах - Grad, EdgeDiv, Wolf. На самом Вольфе в STEX я вертел 4 крутилки, остальные чтобы посмотреть. На надцатой итерации Вольфа я получил подходящий результат и на радостях забыл записать параметры.  
 
Как я уже написал, ScanTailor вообще, и STEX в частности - это неудобное поделие. Потому что, когда после удачной попытки с Вольфом я решил ещё раз проверить Grad, то при изменении параметров для Grad он также поменялись и для Wolf. В результате все значения параметров Вольфа были утеряны.  
 
Это я к тому, что появилась хотелка. Чтобы СТ запоминал значения параметров для каждого из порогов.
 
Как я уже написал, ScanTailor вообще, и STEX в частности - это тормознутое поделие. Поэтому подбирать по новому эти параметры с головной болью от троббера я не захотел. Здоровье дороже. Напоминаю, radius имеет значения от 1 до 9999, coef от 0.01 до 9.99, Thinner/Thicker от -50 до 50. Количество комбинаций значений этих 3 параметров превышает все разумные пределы.
 
На самом деле мне уже глубоко пофигу STEX. Куча потраченного времени и сил в никуда. Которых с одной стороны не жалко, т.к. не мои, с другой стороны жалко - могли бы чего-то полезного сделать, что помогло бы сэкономить время и силы для меня и других пользователей СканТейлора.
ST Deviant туда же. Больше года угрохать на тупиковый проект, который не нужен даже самому его создателю. Хотя, конечно, непомерный труд лучше, чем от водки и от простуд.

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 02:42 07-03-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
и на радостях забыл записать параметры.  

Как удобно.
Даю подсказку: Вы не сможете получить вашу же картинку на чистом пороге Wolf. Но вы можете попробовать. Или можете попробовать получить её в другом удобном вам ПО.
И не было в вашем результате никакой "радости".
 
"Жаль... Жаль, что мы так и не услышали начальника транспортного цеха..."
 
jourmager say:
Цитата:
могли бы чего-то полезного сделать

Говоря точнее, могли бы сделать ничего.

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 03:25 07-03-2025 | Исправлено: zvezdochiot, 03:48 07-03-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Как удобно

Вы своего оппонента читать будете? Или вы видите только то, что вам удобно и начисто игнорируете то, что вам не удобно?
Ещё раз - СканТейлор неудобная программа для пользователя. Нет элементарного запоминания значений параметров пользователя для разных режимов бинаризации.  
 
Добавлю. Отмена сделанного, т.н. Undo, который Ctrl+Z, существует в программах уже десятки лет. Если бы была, я мог бы откатиться назад и восстановить удачные параметры. Но нет. В СканТейлоре этого нет. Это ещё одна хотелка.
 
Ещё раз - описаний крутилок в STEX нет. Как они работают - никто не знает. Вы игнорируете многочисленные просьбы объяснить что вы там наворотили в STEX с порогами и фильтрами или отвечаете настолько маловразумительно, что возникают сомнения в ваших когнитивных способностях.  
 
Поэтому приходиться подбирать значения порогов методом тыка. В ST Advanced при подборе я меняю Window Size и Coeff. Которые понятны и известны, т.к. это стандартная реализация Wolf.  
 
В STEX используется какая-то нестандартная реализация всех порогов с непредсказуемым влиянием неизвестных параметров на результат. К coef и radius (это так Window Size называется?, што за нафиг? вы разницу между окном и радиусом понимаете?) добавлены Thinner/Thicker (откуда он в Wolf?) и "M/N" (?). Т.е. количество возможных комбинаций увеличивается на 2 порядка.
 

Цитата:
Вы не сможете получить вашу же картинку на чистом пороге Wolf.

Но я же её получил. Я легко могу сделать что-то очень похожее, особенно в ST Advanced, но повторить результат в STEX с точностью до каждого пикселя крайне трудозатратно. Проблема в том, что вы доколупаетесь до какого-то одного пикселя, при этом начисто игнорируя изначальную задачу. Из-за вашей своеобразной манеры общения с вами крайне трудно вести конструктивный диалог.
 
А вот ваш результат с Grad/Balance я повторить не смог, так что, пожалуйста, в студию скриншот страницы 70 с параметрами STEX. А результат с EdgeDiv у меня вышел ещё хуже. Так что, пожалуйста, ещё один скриншот в студию.
 
Отдельный вопрос - а какого чёрта делают bounds в Otsu? Откуда вы это взяли? Вы вообще понимаете принцип глобального порога Otsu?

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 12:04 07-03-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
Я легко могу сделать что-то очень похожее, особенно в ST Advanced

Сделайте.
 
jourmager say:
Цитата:
Вы вообще понимаете принцип глобального порога Otsu?

Я с вас улыбаюсь. Опять.
 

   


Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 12:18 07-03-2025 | Исправлено: zvezdochiot, 12:42 07-03-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Напоминаю, что изначальная проблема, озвученная на форуме dwg, заключалась в невозможности корректной бинаризации изображений с тонкими светло-серыми линиями, которые при обычной бинаризации исчезали. Т.е. задача была в подборе режима бинаризации, при котором эти тонкие светло-серые линии будут преобразовываться в черные на максимально возможной длине.
 

 
Слева направо:
1) увеличенный кроп скриншота от zvezdochiot
2) скриншот pdf от zvezdochiot
3) скриншот png, в который был сконвертирован jb2 из pdf от zvezdochiot. Конвертация потребовалась потом что мой XnView эти jb2 не распознавал как корректные.
4) скриншот результата бинаризации в ScanTailor Advanced с порогом Wolf (Window Size = 77, Lower bound = 1, Upper bound = 254, Coeff = 0.05)
5) Результат бинаризации в Book Restorer 4.2.1 (2008)
 
Обращаем внимание на линию под числом 1300, т.к. именно корректная бинаризация этой линии и была целью.
И что мы видим?
1а) На кропе скриншота от zvezdochiot бинаризации нет вообще. Там отчётливо видно градации серого.
1б) скриншота с порогом Grad, с которым по словам zvezdochiot делался pdf, нет. Т.е. сравнивать не с чем. Как удобно!  
Вместо этого EdgeDiv, который типа лучше. Лучше чем что? Если сравнить его со скрином pdf с Grad, то у EdgeDiv разрывы в линии бОльшего размера, чем у Grad - т.е. он хуже - это то, о чём я и говорил.  
4) как ни удивительно, но рисунок линии после бинаризации в ST Advanced в tif более похож на Grad в jb2, чем "лучший" EdgeDiv в tif.  
5) как видим, бинаризация тонких светло-серых линий для Book Restorer, программы 2008 года, также не представляет трудностей, несмотря на то, что имеет только 1 порог и 2 регулятора, вместо 19 порогов и 22 фильтров с общим числом крутилок 16 штук у STEX.
Более того, Book Restorer выполняет бинаризацию в реальном времени с окном предпросмотра, плюс ещё есть кнопка Preview для всего изображения. И без всяких тробберов на 4-8 секунд и без сбросов масштаба. К сожалению, BR не идеален, и имеет значительные огрехи в UX/UI, которые практически сводят на нет его преимущества. Но технологически он на высоте.
 
К сожалению, авторам STEX и ST Deivant подобные проблемы в пользовательском интерфейсе и быстродействии СканТейлора не интересны. В процессе разработки STEX и STD они решают задачи, которые не имеют практической ценности ни для пользователей, ни для них самих. Это такая разновидность решения ребусов или разгадки кроссвордов. Комбинация имитации интеллектуальной деятельности с убийством своего времени. В отличие от авторов всех остальных СканТейлоров, которые решали именно практические задачи пользователей и свои собственные.
 
zvezdochiot

Цитата:
Я с вас улыбаюсь. Опять.

У ру-борда очень строгий кодекс поведения, и я не буду его нарушать.
Ещё раз - что такое radius в Wolf? откуда Thinner/Thicker в Wolf? откуда bounds в Otsu? где скриншот с Grad, чтобы я его попиксельно сравнил с вашим же pdf?
 
И ещё. Пожалуйста. Расскажите, что делают 19 порогов и 22 фильтра и 16 крутилок в STEX. Хотя бы кратко. По 2-3 предложения на пункт - итого 59 пунктов. Даже не надо подробностей и про их комбинации не надо. И скриншотов не надо.

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 14:50 07-03-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
ScanTailor Advanced с порогом Wolf (Window Size = 77, Lower bound = 1, Upper bound = 254, Coeff = 0.05)

Неплохой рецепт. Даже неожиданно. Теперь у меня с запасом.
Осталось победить "маленькую" деталь:
   
Идеи? Применять разные пороги - понятно, но хотелось бы всё-таки одним. Как-никак мой вариант книги был сделан одним порогом с одинаковыми для всех страниц параметрами, с одинаковыми фильтрами, за исключением обложек и одной страницы с цветным графиком.
 
PS: Попробовал "Нижнюю границу" == 127. На данном материале приемлемо, но на других такое не прокатит. Слишком жирно половину диапазона отсекать.

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 15:21 07-03-2025 | Исправлено: zvezdochiot, 15:39 07-03-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
хотелось бы всё таки одним
ну как хотите. У вас свой путь. Под каждую книгу выдумывать свой набор порогов и фильтров. А зачем укладывать других пользователей в своё прокрустово ложе? Напоминаю, что объяснения, как пользоваться и когда применять все эти 19 порогов и 22 фильтра и 16 крутилок в STEX никто так и не увидел.
 

Цитата:
Осталось победить "маленькую" деталь

А чё там победять? Ну увеличьте Window до 300. А потом найдите ещё какой-то не такой пиксель или линию или заливку. И примахайтесь.
 
Справедливости ради скажу, что толкового объяснения, как подбирать Window и Coeff в ST Advanced я тоже не видел. Но, т.к. крутилок только 2, то их подбор методом тыка достаточно прост и быстр. Исходя из данного скана, где темно-серая заливка при бинаризации с Wolf с Window=200 превращалась в рваную черно-белую, а при Window = 300 становилась нормальной чёрной - выскажу предположение, что в данном случае играл роль размер заливки, который по длинной стороне составляет 320 пикселей при dpi=300 и Output Resolution = 600 dpi. Если же установить Output Resolution = 1200 dpi, то требуемое значение Window для однотонной заливки составляет примерно 600. А для 300 - 150.
 
Итак, в ST Advanced при выборе порога Wolf при наличии на изображении областей с однотонной заливкой, которые подлежат бинаризации, необходимо выбирать параметр Window больше, чем половина наибольшего размера в пикселях этой заливки на результирующем dpi, а потом, при необходимости, можно уменьшать значение Window.
 
Как видим, нет ничего трудного, чтобы объяснить значение какого либо параметра в одном предложении.
 
Если я не прав насчёт Window в Wolf - напишите свой вариант.
 
У STEX на вкладке Output есть ещё параметр K-means. Описания, конечно же, нет. В этом параметре можно менять 9 значений. Я решил методом тыка посмотреть, что будет при изменении этого параметра. 17 (семнадцать) секунд на одно изменение. Мой Core i7 тихонько заплакал от своей беспомощности. Слезы лились в 1 поток из 8 со скоростью 4 гигагкапель.
 
Это я к тому, что СканТейлор изначально рассчитывался на реальное практическое применение, когда для различных изображений можно применять разные пороги, наиболее подходящие для каждого конкретного изображения.  
 
К уже озвученным вопросу про то, что же конкретно делает всё это нагромождение фильтров и порогов в STEX, добавлю ещё один: каким образом вы находите оптимальное значение из всего этого невообразимого количества комбинаций фильтров, порогов и их значений в STEX. Вот как вы узнали, что оптимальное значение радиуса равно 3, а не 3.14 или 2.718, или значение коэффициента равно 0.75, а не 0.666 или 1.488?  
 
P.S. что делает bounds в Otsu и Thinner/Thicker в Wolf?
P.P.S. Я так и не смог воспроизвести ваш результат с Grad и EdgeDiv у себя. У меня хуже. У вас или исходники другие или скриншоты. Кстати, последний скриншот с STA тоже в градациях серого. Как вы это умудряетесь? Можете закинуть на какой-то файлообменник ваш jpg-исходник разворота 70-71 страницы и полный скриншот экрана STEX  Grad/Balance при бинаризации этих страниц?

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 17:19 07-03-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
У STEX на вкладке Output есть ещё параметр K-means. Описания, конечно же, нет.

Не туда вас понесло. Вам такое не нужно. Ежели просто знать зачем, то вот.
 
jourmager say:
Цитата:
Если я не прав насчёт Window в Wolf - напишите свой вариант.  

Наоборот. Он у тебя более "прокачан". Ежели бы ещё по Gatos лайвфаг кто дал. Но жирнит на больших окнах будь здоров (Grad отдыхает).
 
jourmager say:
Цитата:
СканТейлор изначально рассчитывался на реальное практическое применение, когда для различных изображений можно применять разные пороги

Не было такого ни разу. Изначально только один порог Оцу и один префильтр "Выровнять освещение". Причём порог изначально был без ползунка. А префильтр до конца зашитым остался, пока отдельно взятый человек не "взбеленился" от такого и не переобозначил данное "безобразие" в STA.
 
jourmager say:
Цитата:
Вот как вы узнали, что оптимальное значение радиуса равно 3, или значение коэффициента равно 0.75

3 - толщина штриха для вытягивания. 0.75 - середина оптимального диапазона данных порогов. Оптимальный диапазон для них - с момента, когда локальная составляющая перевешивает глобальную, == 0.5 до момента, когда локальная составляющая полностью доминирует, == 1.0.
 
P.S: (кстати, в последнем STA есть delta, не ползунок конечно, но как получилось).
P.P.S: JPEG извлечён из PDF с помощью poppler, т.е. без искажений.

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 17:41 07-03-2025 | Исправлено: zvezdochiot, 20:33 07-03-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Не туда вас понесло. Вам такое не нужно.

Я с этим экспериментировал не для данной задачи, а чтобы посмотреть, насколько реально подобрать параметр в K-means по затратам времени - 17 секунд на одно изменение. Ну такое...

Цитата:
Изначально только один порог Оцу

Вы не поняли. Под разными порогами я имел в виду как один тип порога с разными значениями, так и разные типы порога. Т.е. для одной страницы можно выбрать порог Отсу со значеним -22, для другой страницы Otsu со значением +35. и т.д. Потом запустить обработку, и каждая страница обработается со своим порогом (значением порога). А потом можно вернутся и изменить порог (значение порога) и переделать результат.

Цитата:
JPEG извлечён из PDF с помощью poppler, т.е. без искажений

У меня результат не похож на ваш. Т.е. или исходник не тот, или настройки где-то не такие, или работа STEX отличается у меня и у вас. Поэтому я и попросил исходники страниц и скриншота. Интерес тут чисто теоретический.
 
С практической точки зрения меня больше интересует другое - скорость и удобство работы с уже существующими средствами обработки, а не добавление новых. Потому что добавление новых возможностей без исправления существующих проблем только множит хаос.
СканТейлор тратит ресурсы непонятно на что, из-за чего увеличивается время обработки. Бинаризация и апскейл раза в 2 медленнее по сравнению с некоторыми другими программами.
Плюс элементарные проблемы в пользовательском интерфейсе. Типа того же сброса масштаба.
Это куча мест, куда можно приложить силы и на что потратить время, но это не так интересно. как новый порог или "фоторежим" в геометрических искажениях.

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 00:05 08-03-2025 | Исправлено: jourmager, 00:14 08-03-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
или "фоторежим" в геометрических искажениях.

Мне STEX нужен именно из-за геометрических искажений. Именно из-за них все остальные представители семейства ST мне не подходят, независимо от "плюшек". "Плюшки" - это всего лишь бонус, не более того. Для меня всё просто, мне ничего выбирать и сравнивать не надо. Не имеет смысла. Такие вот дела.
 
PS: STEX 1.2025.03.03

Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 00:27 08-03-2025 | Исправлено: zvezdochiot, 00:27 08-03-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot

Цитата:
Мне STEX нужен именно из-за геометрических искажений. Именно из-за них все остальные представители семейства ST мне не подходят, независимо от "плюшек"

В STEX исправление геометрических искажений на 3-м этапе. Т.е. можно сначала в STEX повернуть изображения, разрезать при необходимости, исправить геометрию, потом прогнать в STEX остальные этапы без изменений, после этого изображения с уже исправленной геометрией загнать в STA или какой другой ST по желанию и получить все плюшки типа раздельного вывода в STA, работу с dpi (хотя никто не запрещает потом получившимся изображениям назначить правильный dpi в какой-либо другой программе), а также и другие плюшки.
 

Цитата:
STEX 1.2025.03.03

Опять и снова. Что такое "dewarp: fix FOV" догадываюсь - это очередная итерация "фоторежима" из ST Deviant, не так ли.  
А что такое "output: order by Mode"?
 
Кстати, давно хотел спросить. А что такое и как с этим работать - ползунок Geometric Distortions - Curved lines - Correction model - Depth perception? На одних сканах он работает, на других - нет. Вроде как предназначение понятно, но как-то оно криво реализовано.

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 01:26 08-03-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager say:
Цитата:
можно сначала в STEX  исправить геометрию...  после этого изображения с уже исправленной геометрией загнать в STA или какой другой ST

На кой мне это? Да к тому же мысль неверная: режимы в "5. Поля" являются продолжением "3. Геометрические искажения". Да и сами поля я переделал под выравнивание по текстовому блоку вместо выравнивания по обложке. Мне выравнивание по обложке уже не подходит.
 
jourmager say:
Цитата:
А что такое и как с этим работать

  • STEX issue #15
  • STEX issue #47

  • Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 09:38 08-03-2025 | Исправлено: zvezdochiot, 12:03 08-03-2025
    jourmager

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    zvezdochiot

    Цитата:
    На кой мне это?

    Вы ошибаетесь, если думаете, что я предлагаю какой-то рецепт именно вам, или хочу вас в чём-то убедить. Кроме нас с вами эту тему читают ещё как минимум 10 человек. И если я не увидел никаких опровержений тому, что я написал, ни от вас, ни от кого-то другого, значит мои предположения могут быть верными с большой степенью вероятности. И могут кому-то пригодиться.
     

    Цитата:
    STEX issue #47

    Вы странный. С одной стороны пропагандируете STEX где только можно, его новые функции, особенно в области геометрических искажений, с другой стороны, вместо простого ответа на простой вопрос "а что делает этот ползунок" посылаете вопрошающего на форум, где тот должен разобраться в диалоге из полусотни сообщений и самостоятельно придумать ответ, т.к. простого ответа в тексте конечно же нет, там нет даже упоминания ползунков под названием Depth perception или Восприятие Глубины.
    Так вы слона не продадите.
     
    Предистория. Когда я от нечего делать смотрел какую-то новую версию STEX, то совершенно случайно наткнулся на этот ползунок - Depth Perception и ещё 2 других. На каком-то случайном скане я увидел, как с помощью этого ползунка можно растягивать или сжимать текст по горизонтали сразу по всей плоскости страницы. Ура, подумал я, наконец-то кто-то сделал коррекцию геометрических искажений при сканировании около корешка книги, когда текст как бы уходит в глубину (от стекла сканера вверх) и сжимается по горизонтали. Проблема в таких случаях также в том, что от таких искажений могут дуреть и OCR системы, пробуя подставить сжатый шрифт.
    Но нет. Нифига. Всё как всегда. Во-первых оно так не работает. Во-вторых этим пользоваться нельзя. Ну и фиг с ним.
     
    И вот сегодня, получив вместо простого ответа посыл на 5 букв и 2 цифры, т.е. на Issue 47, я в  
     который раз перечитал и в конце концов понял. zvezdochiot-у на форуме dwg подсунули книгу с геометрическими искажениями страниц, на которых модель исправления STEX сломалась. Почему сломалась - понятно. Реальную жизнь пробуют втиснуть в прокрустово ложе умозрительных простых математических моделей. На сложные модели нет ни времени, ни сил, ни знаний. Там вообще уникальный случай - половинка страницы по диагонали загнута кверху из-за подставки снизу. И вот для исправления этого уникального случая городится огород из 3 ползунков. Браво. Особенно учитывая то, что как ими пользоваться и в каких случаях знает только автор.
     
    zvezdochiot
    Вы странный. С одной стороны вы на словах идеологический противник СканКромсатора, с другой стороны на деле вы действуете точно в рамках идеологии СканКромсатора - на каждую проблему должно быть решение. И добавляете бесконечные фильтры, пороги, ползунки, кнопки, которые нужны для каких-то уникальных случаев. Всё как в СканКромсаторе. Но с двумя отличиями. В СканКромсаторе (в отличие от STEX-а) новые функции документируются в whats new, и в теме на форуме всегда можно получить помощь и объяснение от автора что это такое и как этим пользоваться, вплоть до подробных видео. Такие дела.
     
    И ещё. Все эти исправления геометрии, очистка от мурашек, dewarping, despeckling и все прочие de- имеют результат в любом случае хуже OCR с подстановкой векторных шрифтов.

    Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 12:08 08-03-2025
    zvezdochiot



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    jourmager say:
    Цитата:
    посылаете вопрошающего на форум

    Форум? Кто ещё кого в заблуждение вводит?
     
    jourmager say:
    Цитата:
    Всё как всегда. Во-первых оно так не работает. Во-вторых этим пользоваться нельзя.

    Опять вводите в заблуждение Всё работает ровно так, как может работать.
     
    Первый ползунок регулирует масштаб глубины. Вот только откуда берётся эта "глубина"?
  • У Tulon-а просто - по изменению высоты вертикального столбца между кривыми. Имеет определённый смысл, но при разборе с Нубий-IV стало очевидно, что такой подход отражает только часть реальной глубины.
  • У меня при определении "глубины" столбца к изменению высоты между кривыми добавилась компонента, зависящая от кривизны самих линий и от параметров перспективной проекции. Но всё это опять притянуто за уши и реальной глубины не отражает.
  • И только у Нубий-IV в STD модель строится на определении реальной глубины. Правда только для photo-режима, не совместимого со scanner-режимом. Но всё это ненужно и зря - это же ваши слова. Не так ли?
     
    PS: Обучать как GIT работает не стану. В нём "документируется" каждый чих.
     
    jourmager say:
    Цитата:
    вы на словах идеологический противник СканКромсаторах

    Опа! Чуть не пропустил!
    Я идеологический противник СканКромсаторах? Вы серьёзно? Я против такого инструмента?
    Ну уж нет. Я против свидетелей Кромсатора. Против конкретных людей, "ухвативших бога за бороду".
    Я бы и сам не прочь пользоваться СК для нетипового материала, но он только под винду. Поэтому стараюсь держаться подальше от нетипового материала.
    И разумеется определённые моменты реализации СК сильно удручают. Например, полная потеря размётки страниц на выходе . Это же просто неразумно.

  • Всего записей: 849 | Зарегистр. 18-05-2023 | Отправлено: 12:49 08-03-2025 | Исправлено: zvezdochiot, 13:28 08-03-2025
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

    Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 3)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2025

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru