Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39130 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 17:04 07-10-2024
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
я как-то писал, что до конца весны работа над СК приостановлена, все планы аннулированы. В мае уже буду принимать решение о том, закрывать ли проект окончательно. Сейчас желания развивать его нет.

Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
На мой взгляд, версия 6,97 имеет все необходимые функции, чтобы делать превосходные книги. Единственно, в ней надо устранить те баги, которые выявлены и очевидны. И мне представляется, что следует создать Хрестоматию всех функций программы и того, как правильно пользоваться программой. Потому что пересматривать все ролики автора и других пользователей не очень удобный способ обучения. А при наличии более полной Хрестоматии, и опытным путем пользователь сможет отточить свои навыки более быстро и эффективно. Имеющаяся Хрестоматия, надо признать, устарела. Теперь требуется Хрестоматия специально под версию 6.97.

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 11:44 07-01-2024
1234olexiy

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
я как-то писал, что до конца весны работа над СК приостановлена, все планы аннулированы. В мае уже буду принимать решение о том, закрывать ли проект окончательно. Сейчас желания развивать его нет.
 

Я думаю неплохо было бы все-таки добавить авторасстановку зон картинок хотя бы, как бы это сократило время обработки!

Всего записей: 16 | Зарегистр. 18-11-2019 | Отправлено: 01:29 08-01-2024
regulus777

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте!
Подскажите, пожалуйста, как мне исправить смазанные буквы и цифры после бинаризации изображений в Скан Кромсаторе, Скан Тейлоре либо других программах? Я сканирую книгу Двайта "Таблицы интегралов", там мелкий текст и степени в формулах мелким шрифтом. Сканирую в разрешении 600 dpi. После прохождения бинаризации целый ряд степеней смазываются и становятся неразличимым для глаза, например двойка превращается в восьмерку. Пытался снизить порог бинаризации, но не помогает, а если я его снижаю ниже 100, то пропадают элементы в других формулах, например черта, обозначающая дробь. Как решается данная проблема? Или надо сканировать в 1200 dpi, но мой сканер Avision fb2280e не позволяет сканировать в таком разрешении.

Всего записей: 31 | Зарегистр. 06-09-2010 | Отправлено: 06:01 08-01-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Подскажите, пожалуйста, как мне исправить смазанные буквы и цифры после бинаризации изображений в Скан Кромсаторе, Скан Тейлоре либо других программах? Я сканирую книгу Двайта "Таблицы интегралов", там мелкий текст и степени в формулах мелким шрифтом. Сканирую в разрешении 600 dpi.

Выложите один исходный скан. Надеюсь JPG-сжатие не используете.

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 07:06 08-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
regulus777
надо сканировать в 1200 dpi, но мой сканер Avision fb2280e не позволяет сканировать в таком разрешении

иногда может помочь подъём разрешения через нейросетевые технологии (проги типа photozoom или Topaz Gigapixel AI).

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 07:35 08-01-2024
regulus777

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Выложите один исходный скан. Надеюсь JPG-сжатие не используете.

 
Вот ссылка на страничку скана:  
https://disk.yandex.ru/i/y_BewhcyE5cLjw
TIFF, 600 dpi, gray.
 
После обработки в СК получается так:
https://disk.yandex.ru/i/m86GsEylyY63Kg

Всего записей: 31 | Зарегистр. 06-09-2010 | Отправлено: 10:06 08-01-2024 | Исправлено: regulus777, 10:09 08-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
regulus777
два быстрых решения:
- либо ставить мелкие зоны особого порога бинаризации (на закладке бинаризации внизу их порог, где галочка)
- либо picture-зону/зоны, где вытягивать контуры. мне навскидку кажется что ничего хорошего из этого не выйдет при такой печати. там реально тройка от восьмерки неотличима.
 
Либо муторный путь: заменять глифы.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 10:44 08-01-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Считаю, нормально у вас получилось.  
 
А то, что например в последней строке, в формуле 191.17. степень 3/2 превращается жуткое пятно, так то брак полиграфии. Там исходно месиво из краски.  Не верю, что можно найти/подобрать  методы бинаризации для превращения той "3-ки" во что-то удобоваримое.    

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 10:56 08-01-2024 | Исправлено: AlVaKo, 10:59 08-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
кое-что можно

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 11:59 08-01-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всё та же клякса, в которой, при желании, можно увидеть множество разных символов.

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 12:24 08-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Всё та же клякса

да. только намёк на искривление в сторону "3". но я и не старался что-то выжать.
если по уму, то потом надо весь текст проходить глазами и менять глифы во всех сомнительных местах.
 
Лично я бы поискал другой экземпляр книги. Как правило, если брак приходился на одну-две тетрадки, во втором экземпляре они куда лучше. Конечно, бывает и облом.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 12:30 08-01-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Лично я бы поискал другой экземпляр книги

Ну да, например такой

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 13:39 08-01-2024
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
regulus777

Цитата:
Вот ссылка на страничку скана:  
https://disk.yandex.ru/i/y_BewhcyE5cLjw  
TIFF, 600 dpi, gray.  

Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
Я обработал Ваш скан, получил результат, с которым Вы можете ознакомиться, скачав архив с адреса: https://workupload.com/file/nk32KVSAk3A
Однако, по моему мнению, дело заключается в том, что Вы неверно взяли режимы сканирования книги.
1.    Совершенно излишне Вы сканировали с DPI 600, вполне достаточно было бы DPI 300.
2.    Прежде чем сканировать, сканер позволяет настроить режим сканирования – яркость, контрастность, кривые изображения, уровни цвета (тона). Настраивая эти параметры, в итоге можно получить на выходе после сканирования изображение очень хорошего качества с четкими символами (буквами).
3.    Вы не использовали на выходе при обработке в СК режим удвоения разрешения. У вас, как входной скан, так и выходное изображение, имеют одинаковое разрешение. Это противоречит правилам сканирования книг (да и любого изображения для обработки в последующем в СК).
Поэтому, мне представляется, что Вам не следует искать другую книгу, а следует пересканировать ту, которая у Вас имеется, но с правильными настройками сканера, и в итоге Вы получите отличный результат.
 
Добавлено:
regulus777
C другой стороны, «поиграв» немного с настройками СК, удалось получить еще более лучший вариант, скачать его сможете с адреса: https://workupload.com/file/jKKREUqyzjZ
ВНИМАНИЕ!!! Глифирование не использовал принципиально, потому что это уже редактирование выходного скана. А я хотел показать, что даже без редактирования, настройками программы можно добиться приемлемого результата.
C уважением

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 17:06 08-01-2024 | Исправлено: SVK2I, 17:16 09-01-2024
regulus777

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
SVK2I
 
Вот спасибо огромное! Вы - мастер))) Что ж, буду учиться нормально сканировать и обрабатывать сканы. Второй вариант Ваш потрясный.

Всего записей: 31 | Зарегистр. 06-09-2010 | Отправлено: 18:53 08-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
 
regulus777
только не забывайте, что использовав настройки/регулировки сканера вы заблокируете применение последующих программ. У их алгоритмов уже не будет многих возможностей. Я бы не советовал крутить что-то в сканере. Да и понижать разрешение вдвое тоже плохой совет для мелких индексов. Там где на 600дпи что-то видно как перепад яркости двух пикселей, на 300дпи останется уже просто одно среднесерое пятно.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 21:33 08-01-2024
SVK2I

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
только не забывайте, что использовав настройки/регулировки сканера вы заблокируете применение последующих программ. У их алгоритмов уже не будет многих возможностей. Я бы не советовал крутить что-то в сканере. Да и понижать разрешение вдвое тоже плохой совет для мелких индексов. Там где на 600дпи что-то видно как перепад яркости двух пикселей, на 300дпи останется уже просто одно среднесерое пятно.

Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
Как можно, изменяя настройки сканера, заблокировать применение последующих программ (очевидно, имеются в виду программы, использующие драйвера сканирования)? Гипотетически это возможно, если применять драйвер сканирования, установленный в системе. Но так поступают только «чайники». Грамотный пользователь использует только драйвер сканирования, поставляемый с программным обеспечением для сканера (TWAIN).
Поэтому сколько бы ни крутил настройки драйвера сканера, всё это возвращается только в работе самого сканера и никаких иных других программ. Поэтому не надо бояться изменять настройки с умолчания, чаще всего, они не самые лучшие.
Благодаря Аллаха Величайшего, Благословен Он вечно, я отсканировал более сотни книг. И не было случая, чтобы при DPI 300, что-то было в мелких символах потеряно в сравнении с DPI 600. Особенно это важно при обработке текстов на арабском и других аналогичных языках с их знаками огласовки гласных (диакритикой), да и сами буквы имеют точки, отдельно стоящие от самой буквы. Все зависит от правильности настройки драйвера сканера и снятия пробных вариантов самых сложных страниц на двух этих разрешениях, чтобы в итоге принять окончательное решение – на каком же разрешении следует сканировать книгу в целом (разумеется, что сканировать  одни страницы в одном разрешении, а другие в другом – категорически недопустимо, замучаешься потом исправлять разницу в размерах страницы).
Ещё раз повторю, что правильная настройка драйвера сканера – единственный путь к успеху получения прекрасного итогового результата на DPI 300.
А когда правильно отсканировал книгу, остальное за квалификацией пользователя в использовании возможностей СК, что – самое трудное в этой жизни без хорошего обучения и опыта работы.
С уважением

Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 17:01 09-01-2024 | Исправлено: SVK2I, 17:05 09-01-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
SVK2I
очевидно, имеются в виду программы, использующие драйвера сканирования

нет.
вчитайтесь:

Цитата:
У их алгоритмов уже не будет многих возможностей.


Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 18:56 09-01-2024
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Я не совсем понял как работать с карманом.

 
Вот сейчас свойство заносится в карман? А как это можно увидеть?
И как можно свойства из кармана присвоить горячей клавишей другой зоне, которую я для этого выделю.

Всего записей: 600 | Зарегистр. 04-05-2016 | Отправлено: 13:11 10-01-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В соседней теме во время обсуждения проблемы бинаризации сканов я написал несколько постов, где упоминался ScanKromsator и его автор.
Я сам не являюсь квалифицированным пользователем ScanKromsator. поэтому бы хотел проверить свои утверждения.
1)
Цитата:
фактически в ScanKromsator есть 4 типа порогов: глобальный с разными значениями (Normal. LowDark, MiddleDark, LowLight, MiddleLight, HighLight, Custom, Auto), два адаптивных (HighDark и Smooth), и AutoW (Wolf)

Вообще-то, насколько я понимаю, Wolf тоже адаптивный, т.е. адаптивных типов порогов - три.
2)
Цитата:
в ScanKromsator адаптивный порог HighDark был уже в 2005, а адаптивный Smooth в 2006, т.е. за 2-3 года до появления ScanTailor.

Вообще-то, первая найденная мною версия ScanKromsator 3.5 от 11.02.2004 уже имела во вкладке Convert опцию HighDark, но я не был уверен, был ли он тогда адаптивным. А вот в 2005 сам автор в этой теме написал, что HighDark - адаптивный.
Так всё-таки, можно ли точно сказать, когда в ScanKromsator появилась возможность бинаризировать сканы с использованием адаптивного порога?
3)
Цитата:
Автор СканКромсатора, имея очень большой опыт сканобработки и имея большое и активное сообщество пользователей его программы, умудрился обойтись (и все пользователи СК) тремя-четырмя типами порогов бинаризации

Вот тут посложнее. Для ответа на этот вопрос надо или быть в теме, или долго и нудно шерстить все темы по СК. Простым поиском обойтись тут трудно.
Т.е. вопрос таков - действительно ли автору и пользователям СК хватало существующих типов порогов и не было нужды ещё в десятке других типов?
Или может всё-таки хотелось добавить какой-то Bradley или Dots8?
Про то, что за время существования программы типы порогов добавлялись - сначала Smooth, потом AutoW - я знаю. Но, ИМХО, они добавлялись из-за насущной необходимости исходя из опыта пользователя, а не по простым хотелкам "чтобы было".
4)
Цитата:
Если исходить из данного объяснения, что Sauvola - это развитие Niblack, а Wolf - это развитие Sauvola, то становится понятным, почему автор ScanKromsator с примерно 15-ти летним опытом развития своей программы и таким же опытом оцифровки книг, выбрал Wolf. Просто из этой тройки - Niblack, Sauvola, Wolf - выбрал самый продвинутый.

Вообще-то тут 2 вопроса.  
Во-первых, я написал про 15 лет опыта, чтобы меня не упрекнули в накрутке. Опять же, СК 3.5 - это 2004 год. т.е. опыт автора в развитии программы как минимум 20 лет. А сколько на самом деле?
Про 15 лет опыта в оцифровке я написал, каюсь, наобум, думая, что опыт в оцифровке примерно равен опыту в развитии СК. А какой на самом деле опыт оцифровки?
Во-вторых, про выбор Wolf, про то, что из тройки Niblack, Sauvola, Wolf был выбран самый продвинутый. Естественно, это мои домыслы.
Вообще-то я понимаю, что на выбор могло повлиять многое, но интересно узнать что именно?

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 21:24 10-01-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ни разу не использовал волка и прочих адаптивных при обработке. Otsu всегда включаю только в bw-зонах, причем только его и использую. Уже не раз писал, что предварительное убирание фона и (unsharp+enhance contour) решает практически все проблемы. И, как правило, повышение резкости компенсирую blur/smooth-фильтрами. И здесь приходится искать компромисс между четкостью перемычек/серифов и появлением зазубрин/дырок, вызванных sharp-фильтрами. С дырками борюсь с помощью white despeckle, но нужно быть осторожным с мелкими буквами, цифрами и ч/б рисунками, а также буквой "з" с центральной частью в виде петельки в старых книгах (на этот случай включаю опцию защиты буквы от despeckle с помощью ocr).
Вольфа добавил по просьбе, если не ошибаюсь, TelecomUral

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 10:04 11-01-2024 | Исправлено: bolega, 14:32 11-01-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru