Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
Nitrofest

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Доброго времени суток.
 
прежде всего - спасибо всем, кто причастен к разработке и поддержке этой замечательной программы. Столкнулся с необходимостью оцифровать книгу - и сразу понял, насколько же программа ваша незаменима.
 
Вопрос, по большому счёту, к ScanKromsator прямого отношения не имеет, но я решил, что задать его тут будет уместно.
 
Успешно обработал программой книгу с большим количеством черно-белых иллюстраций. Применял для них exclude region - dithering. После обработки страницы с картинками упорно не хотят добавляться в djvu ни одним из кодировщиков. Выдаётся неопознанная ошибка.
 

 
Страница целиком
http://ifolder.ru/13839274
 
Извиняюсь за дилетантский вопрос.  
 
И вдогонку - существует ли альтернатива лизардовскому софту для кодирования?
 
Спасибо заранее за ответ.

Всего записей: 46 | Зарегистр. 04-09-2009 | Отправлено: 00:51 04-09-2009 | Исправлено: Nitrofest, 00:55 04-09-2009
chesskom



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
 
Nitrofest,
 
PDF version: (only 104 KB)
_http://www.onlinedisk.ru/file/210648/
 
 
 

Всего записей: 1083 | Зарегистр. 02-07-2005 | Отправлено: 04:53 04-09-2009
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nitrofest

Цитата:
Применял для них exclude region - dithering.

а почему не picture zones?
 
P.S.: По сканообработке есть, кстати, отдельный топик
http://forum.ru-board.com/topic.cgi?forum=93&bm=1&topic=3172&start=60#lt

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 09:12 04-09-2009 | Исправлено: Olive77, 09:14 04-09-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nitrofest

Цитата:
Применял для них exclude region - dithering.

А надо было - Picture-зоны + http://www.djvu-soft.narod.ru/scan/djvu_imager.htm .
 
Добавлено:

Цитата:
После обработки страницы с картинками упорно не хотят добавляться в djvu ни одним из кодировщиков. Выдаётся неопознанная ошибка.

Сконвертируйте TIF в BMP и затем в DjVu - это просто кодировщик Ваш TIF не переваривает - не нравятся метаданые, видимо (или какие-то TIF-тэги).
 
Обычно помогает пакетный перегон TIF -> TIF в IrfanView, но на сей раз и это не помогло.
 
PS Может быть вообще строит указывать в инструкциях типа ScanAndShare, что сканировать следует в BMP, а не в TIF? Тогда такие проблемы будут гарантированно исключены.
 
Добавлено:

Цитата:
И вдогонку - существует ли альтернатива лизардовскому софту для кодирования?  

Да. Это http://minidjvu.sourceforge.net/ . Но он кодирует в DjVu исключительно чёрно-белые 1-битные сканы и по уровню сжатия немного (13-15%) уступает лизардовскому софту для кодирования.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:33 04-09-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Обычно помогает пакетный перегон TIF -> TIF в IrfanView, но на сей раз и это не помогло

Скорее всего, это из-за большой dither-картинки. Возможно, кодировщик из-за бага не переварил слишком большое кол-во паттернов
 
Добавлено:

Цитата:
что сканировать следует в BMP, а не в TIF? Тогда такие проблемы будут гарантированно исключены.

А при чем тут сканирование? Важен формат после обработки, а не до.

Всего записей: 4548 | Зарегистр. 09-09-2002 | Отправлено: 11:08 04-09-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Обычно помогает пакетный перегон TIF -> TIF в IrfanView, но на сей раз и это не помогло.  
Этот прием для серых сканов. В данном случае bw G4Fax. Такие сканы DEE без проблем переваривает.
В данном случае кодер падает из-за сложного растра. У меня и Корел на этом скане при некоторых обработках падает (редкий случай).
Если в настройках профиля битонал включить Disable Halftone то DEE скан переваривает, но прилично вычищает рисунок. Размер у дежавю больше 500 кб.
 
Вообще делать dithering серых рисунков плохая идея. Надо рисунки доработать (в СК или во внешнем редакторе) и оставить скан серым. Тогда при кодировании можно получить приличный результат.
 

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 14:19 04-09-2009
Nitrofest

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо за советы.
 
К сожалению, перевод в bmp не помог. Smalldjvu по-прежнему выдаёт ошибку. Djvu editor теперь открывает все файлы, но сохранить документ по-прежнему не может. minidjvu тоже не справился.
 
Похоже, дело не в tiff, а в самих дизер-зонах. Беда какая-то с ними. Есть идеи, почему их не переваривает кодировщик? И для каких случаев они вообще нужны?  
 
monday2000, вы советуете использовать picture zone. Может всё переделать с picture зонами? Хотя качество с дизерингом меня вполне устраивает.

Всего записей: 46 | Зарегистр. 04-09-2009 | Отправлено: 14:26 04-09-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nitrofest
 
На скорую руку http://abab.front.ru/job1_1.djvu

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 14:36 04-09-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Nitrofest

Цитата:
И для каких случаев они вообще нужны?  

Для небольших (т.е. реально маленьких) полутоновых иллюстраций. Бывает еще, что внутри векторного ч/б рисунка есть небольшие закрашенные полутоном области. Тогда их проще и лучше локально отдизерить, чем все делать как picture-зону или все бинаризовывать (тогда они превратятся в черные некрасивые пятна)
Есть еще один тип иллюстраций, который лучше дизерить, чем делать gray. Это скриншоты окон в компьютерных книгах. Если переводить их в gray, то в djvu они сильно мылятся, даже если использовать специальные (недефолтные) профили DEE. Скриншоты изначально имеют плохую читаемость (по крайней мере в исполнении наших типографий), а после кодирования в DEE еще более ухудшаются. Дизеринг же их неплохо сохраняет.
Сейчас меня возможно заклюют, что мол, чрезмерный дизеринг дает большой размер djvu. Это так. Но по мне, так уж лучше 100-мегабайтная книга без искажений и с четкими иллюстрациями, чем 1-мегабайтный файл с мыльными разводами. Впрочем, много людей предпочитают именно последнее в ущерб качеству.

Всего записей: 4548 | Зарегистр. 09-09-2002 | Отправлено: 15:35 04-09-2009 | Исправлено: bolega, 15:49 04-09-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Цитата:
Скриншоты изначально имеют плохую читаемость (по крайней мере в исполнении наших типографий), а после кодирования в DEE еще более ухудшаются.
Положение можно немного поправить, если обработать рисунки (чтобы в итоге помочь кодеру, ну и так). Чуда увы не происходит, но можно получить более-менее удовлетворительный дежавю.

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 16:25 04-09-2009
Nitrofest

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
благодарю ещё раз за советы.
 
Переделал с picture zones по методу с djvu imager. Всё получилось красиво

Всего записей: 46 | Зарегистр. 04-09-2009 | Отправлено: 16:34 04-09-2009
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Положение можно немного поправить, если обработать рисунки  

Я так и делал, но параметры там неочевидные.
Давно не делал книги со скриншотами, надо будет тоже попробовать с помощью djvu imager.
Последний раз я сделал так: для переведенной на русский язык книги нашел английский электронный векторный вариант, выдрал из него скриншоты и вставил в скан как внешние picture-зоны Метод работает, если в нашем издании не локализовали скриншоты

Всего записей: 4548 | Зарегистр. 09-09-2002 | Отправлено: 17:00 04-09-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
надо будет тоже попробовать с помощью djvu imager.  
Я понял, что это мм... вариант метода разделенных сканов . Рисунок целиком помещается в фон. Т.е. преимуществ перед кодированием в DEE (и в FSD) ИМХО нет.

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 17:15 04-09-2009 | Исправлено: Arcand, 17:26 04-09-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
А при чем тут сканирование? Важен формат после обработки, а не до.

Да это касательно ScanAndShare просто мысль мелькнула - я её записал, чтобы не забыть.
Arcand

Цитата:
Т.е. преимуществ перед кодированием в DEE (и в FSD) ИМХО нет.

На вкус и цвет... Зато это ИМХО более гибкий и наглядный для юзера способ - чем муторная подготовка сканов под DEE (для случая полутоновых иллюстраций).
 
К тому же DjVu Imager позволяет прямо "по месту" (при кодировании в DjVu) "интерактивно" размылить полутоновые иллюстрации до желаемой степени (или, что то же самое, "интерактивно" снизить размер получаемого DjVu). Это удобно, просто и наглядно, в то время как при использовании DEE надо "размыливать" сканы не в самом DEE - а в СК или Кореле (лишний гемор).
 
DjVu Imager - это удобство и простота (разумеется, для определённой категории сканов).
 
Добавлено:
bolega

Цитата:
Есть еще один тип иллюстраций, который лучше дизерить, чем делать gray. Это скриншоты окон в компьютерных книгах. Если переводить их в gray, то в djvu они сильно мылятся, даже если использовать специальные (недефолтные) профили DEE.  

DjVu Imager позволит очень гибко подобрать желаемую степень размыливания для таких сканов.
 
Добавлено:
Nitrofest

Цитата:
Хотя качество с дизерингом меня вполне устраивает.

Разумеется, это по определению гораздо более лучшее качество, чем Picture-зоны + DjVu Imager. Ведь слой маски в DjVu-файле идёт с высоким разрешением - а слой заднего фона - с низким. Но зато размер у варианта с дизерингом, как правило, огроменный получается (+ ещё такие косяки вот с ошибкой кодирования, оказывается, бывают).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 18:14 04-09-2009 | Исправлено: monday2000, 18:22 04-09-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
в то время как при использовании DEE надо "размыливать" сканы не в самом DEE - а в СК или Кореле (лишний гемор).  
Хочу пояснить суть дела для посетителей топика. Кодер размыливает сканы (фон) - это особенность его метода кодирования. В прогах же выполняется удаление растра (это ну никак не размыливание) плюс обработки: тоновая коррекция, (факультативно) контурная резкость. Все это с целью улучшить рисунок и результат кодирования - кодер уже заметно меньше искажает/размыливает такой рисунок.
 
ЗЫ: Нормальные герои всегда идут в обход

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 18:51 04-09-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
ЗЫ: Нормальные герои всегда идут в обход

Оба подхода имеют право на жизнь. Но Ваш подход требует бОльшей квалификации от юзера. DjVu Imager же прост как палка - а результаты выдаёт при этом весьма приличные. Чтобы достичь то же самое Вашим подходом (через СК-Corel-DEE), нужно проявить немалое мастерство (это можно считать сравнительным недостатком Вашего подхода).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:31 04-09-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Цитата:
Чтобы достичь то же самое Вашим подходом (через СК-Corel-DEE), нужно проявить немалое мастерство (это можно считать сравнительным недостатком Вашего подхода).
Неверное утверждение. Интересно, на чем же оно основано?
Кодеры в documenttodjvu, msepdjvu, в phototodjvu, в с44 кодируют фон с помощью алгоритма IW44. Т.е. по идее одинаково! Поэтому, если специально не обрабатывать картинки, то результаты кодирования при одинаковых настройках для фона в DjVu Imager, DEE и FSD будут идентичны (без учета сегментации рисунка в DEE).
Дополнительная обработка рисунков (удаление растра, тоновая/цветовая коррекция, адаптивное размытие, сглаживание, контурная резкость - такие обработки в том или ином сочетании я применяю) позволяет при тех же настройках фона кодера существенно улучшить рисунок в дежавю.
 
ЗЫ: Как я понял рисунки в DjVu Imager специально не обрабатываются. Тогда как же повышается качество рисунков? Может там кодер фона особый?

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 07:04 05-09-2009 | Исправлено: Arcand, 07:07 05-09-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Arcand

Цитата:
Кодеры в documenttodjvu, msepdjvu, в phototodjvu, в с44 кодируют фон с помощью алгоритма IW44. Т.е. по идее одинаково!

Всё же не "алгоритма", а "в рамках формата". Отсюда следует что реализация алгоритма может быть различна. Как например в случае с jpeg2000.
 

Цитата:
Поэтому, если специально не обрабатывать картинки, то результаты кодирования при одинаковых настройках для фона в DjVu Imager, DEE и FSD будут идентичны (без учета сегментации рисунка в DEE).
Дополнительная обработка рисунков (удаление растра, тоновая/цветовая коррекция, адаптивное размытие, сглаживание, контурная резкость - такие обработки в том или ином сочетании я применяю) позволяет при тех же настройках фона кодера существенно улучшить рисунок в дежавю.

Сомнительное заявление. Особенно "улучшить рисунок в дежавю". Про "улучшить рисунок" могу поверить, а про "в дежавю" - имхо излишнее.
 
Действительно теоретически при кодировании "размытие, сглаживание" может убрать "шумы" (с точки зрения восприятия человеком), которые опять же, теоретически, кодер IW44 может специально сохранять (т.к. с точки зрения кодера считается не шумом, а полезными данными). В таком гипотетическом случае да, возможно сильнее сжать и при этом картинка, с точки зрения человека, будет "выглядеть лучше".
 
Добавлено:
Как обстоят дела в реальности не знаю. Просвятите кто автор(ы) реализации кодеков ? И есть ли в них разница ?

Всего записей: 6999 | Зарегистр. 31-08-2008 | Отправлено: 15:14 05-09-2009
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch

Цитата:
Как обстоят дела в реальности не знаю. Просвятите кто автор(ы) реализации кодеков ? И есть ли в них разница ?
У меня была гипотеза, что JPEG2000 имеет некую простейшую встроенную шумодавилку. Во всяком случае, при сравнении IW44 и JPEG2000 я получал на шумном материале существенно лучшее качество в пользу JPEG2000. Возможно, это особенность самого алгоритма, и никакой отдельной шумодавилки нет.
 
Arcand прав в том, что перед кодированием в DJVU обработка ОБЯЗАТЕЛЬНА - как для текстового слоя, так и для картинок. Если кодировать в PDF (JBIG2+JPEG2000), то возможны некоторые исключения, которыми можно пренебречь - например, цветная периодика-однодневка
В общем, лучше всегда проводить предобработку сканов независимо от конечного формата. Обрезать в любом случае нужно, а если обрезать, то почему не обработать.
 
Что касается раздельного кодирования, проще FSD быть уже ничего не может - тут важно было найти саму возможность (спасибо manfred&Arcand), а реализацию усложнить практически невозможно...

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 16:42 05-09-2009
Arcand

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch
Цитата:
Сомнительное заявление. Особенно "улучшить рисунок в дежавю". Про "улучшить рисунок" могу поверить, а про "в дежавю" - имхо излишнее.  
Мое заявление основано на опыте. А Ваше утверждение на чем?
Именно улучшить рисунок и именно в дежавю. Растр усложняет кодирование.
В случае DEE часть растровых точек попадает в маску, часть в фон - такое ощущение, что сегментер дергается. Результат иногда получается отвратительный. Если растр убрать и подчеркнуть (контурной резкостью) переходы, то рисунок сегментируется и кодируется почти как по маслу. Остается подобрать разрешение фона и его качество, чтобы рисунок в дежавю был как надо.
В FSD (рисунок целиком помещается в фон) ситуация несколько иная. Но все равно, растр кодер размывает не лучшим образом. Иногда это выглядит как если бы на свежеотпечатанный рисунок попрызгали водой - разводы, смазанность. Если растр профессионально убрать, рисунок в дежавю будет уже заметно лучше выглядеть.

Цитата:
Отсюда следует что реализация алгоритма может быть различна. Как например в случае с jpeg2000.
Про различие кодеров возможно. Но если оно и есть, то не принципиальное. Как и в случае jpeg2000.
 
ЗЫ: Вообще-то здесь все это офтопик. Приношу извинения  и закругляюсь.

Всего записей: 2495 | Зарегистр. 28-05-2004 | Отправлено: 17:51 05-09-2009 | Исправлено: Arcand, 17:56 05-09-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru