Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Нажимаю что сказали - ничего не объединяется.
 
Добавлено:
shch_vg

Цитата:
Нажимаю, но выходит такое опять:
Error "Command unavailable for current Page Type option value (Auto)".  

 
 
Добавлено:
shch_vg
Не работает говорю же. Подскажи что делать?

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3538 | Зарегистр. 22-12-2003 | Отправлено: 20:27 01-07-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Dracula
Что делать, я уже написал выше.
Что Вы нажимаете, я видеть не могу, единственное, что могу добавить, это то, что после указанных мной действий никакого объединения не должно происходить.
Просто зоны обработаются заново, в задании они не будут привязаны к своим страницам, и при желании их можно будет заменить на обработанные Вами, после чего объединить с текстом.
К вышесказанному добавить ничего не могу.
Если Вы так и не поняли, что надо делать, выберите в Вашем задании ОДНУ страницу, на которой есть хотя бы одна зона, затем создайте sub-task на нее (File->Create sub-task...->OK), затем заархивируйте получившуюся директорию task и выложите ее на какой-нибудь обменник.

Всего записей: 7164 | Зарегистр. 14-01-2005 | Отправлено: 00:50 02-07-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Да, честно говоря не понял как это заменить обработанные мной, если они уже объединились (к примеру текст и 1 картинка на странице уже внедрена).
Вот залил 1 разворот книги - сорри за размер 13,7 мб (заархивировал, изначально было вообще 25 мб - цветная страницы tiff как Вы знаете столько занимает при сканировании).
http://rghost.ru/private/56682864/82bb2c630d827cda1914e8cf480a7195

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3538 | Зарегистр. 22-12-2003 | Отправлено: 01:46 02-07-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Dracula
Вроде бы мы общаемся на русском языке, а Вы не делаете то, что я написал.
Меня АБСОЛЮТНО НЕ ИНТЕРЕСУЕТ разворот из Вашей книги. Я предлагал сделать sub-task одной страницы (в Вашем случае одного разворота) и описал, как это сделать. Это нужно для того, чтобы понять, как Вы обрабатывали этот разворот. Если Вы это не можете сделать, то я Вам ничем помочь не могу.

Цитата:
Да, честно говоря не понял как это заменить обработанные мной, если они уже объединились (к примеру текст и 1 картинка на странице уже внедрена).  

Если Вы действительно делали в своем задании picture-зоны, то в директории out кроме страниц с объединенными зонами должны находиться и тифы, в расширении которых присутствует слово "pic". Это и есть те зоны, которые Вы должны заменять. После объединения зон с текстом задание теряет связь между сканом страницы и сканами зон, расположенных на этой странице. После повторной обработки зон эта связь восстанавливается, и хотя на скане с текстом остается старая объединенная зона, но появляется возможность обработать зону, как это нужно, и заменить при повторном объединении старую зону на скане страницы на новую, устраивающую Вас.
Как Вы дополнительно обрабатывали свои картинки, я не знаю, да и не очень хочу знать. А что-то еще посоветовать смогу, только увидев в sub-task, как Вы обрабатывали этот разворот.
Если все, что я Вам написал выше и ранее Вам непонятно, то я ничем помочь не могу, Вам надо изучить работу в программе Сканкромсатор, увы!

Всего записей: 7164 | Зарегистр. 14-01-2005 | Отправлено: 02:56 02-07-2014 | Исправлено: shch_vg, 02:58 02-07-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Я предлагал сделать sub-task одной страницы (в Вашем случае одного разворота) и описал, как это сделать. Это нужно для того, чтобы понять, как Вы обрабатывали этот разворот.

Но я именно так и сделал. Там и разворот книги после скана и 2 отдельные страницы после обработки в ScanKromsator даны.
 
Добавлено:

Цитата:
Если Вы действительно делали в своем задании picture-зоны, то в директории out кроме страниц с объединенными зонами должны находиться и тифы, в расширении которых присутствует слово "pic".

Да такое есть отдельные фото моих выделенных в picture zones файлы лежать с названиями pic.0001 и т.д.
 
Добавлено:

Цитата:
Это и есть те зоны, которые Вы должны заменять.

Заменять на что? Я их уже обработал в данной папке (out) - но объединиться они не захотели.
Только 7 рисунков объединились, которые я заново переобработал в ScanKromsator (подтянул picture zone - т.к. подпись к рисунку налазила на рисунок).  
По Вашему нужно книгу всю снова обработать и снова проверить и убрать всякие спеклы - снова все картинки обрабатывать (увеличивать яркость и т.д.)? Это же сколько опять времени займёт.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3538 | Зарегистр. 22-12-2003 | Отправлено: 10:18 02-07-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula
Вы должны понимать, что объединение зон с текстом - необратимая операция. И выполняется в самый последний момент, когда все проверено.
После объединения СК во внутренних структурах зоны взводит флажок, который отвечает за признак слияния. Теоретически можно было бы флажок просто сбросить в ноль, тогда переобрабатывать зоны не нужно будет. Практически же такой команды на данный момент нет. Важно еще, что переобработка зоны может привести к нежелательным последствиям: ее новое положение может не совпасть с тем, что было до переобработки. Это происходит, если в постобработке менялись размеры зоны, были ручные сдвиги страницы или их габаритов. Кстати, в готовящейся версии СК теперь это контролирует и выдает предупреждения (уже сделано).
Самое главное - нет никакого смысла вообще объединять зоны. СК сам умеет делать djvu, слияние зон он делает на лету, когда сочтет нужным, при этом выходные файлы не меняются, т.к. слияние выполняется во временные файлы.
 

Цитата:
Нажимаю, но выходит такое опять:  
Error "Command unavailable for current Page Type option value (Auto)".  

Здесь по-моему все написано понятно: на закладке book Page type = auto. Что говорит о том, что СК не знает, какой ему нужно выдерживать размер страниц (книги). В таком состоянии слияние невозможно. Page type должен быть равен fixed и заданы размеры книги. Похоже, задание пошло вразнос.

Всего записей: 4548 | Зарегистр. 09-09-2002 | Отправлено: 11:01 02-07-2014 | Исправлено: bolega, 11:09 02-07-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Dracula

Цитата:
Но я именно так и сделал.

Вы меня ввели в заблуждение, написав, что выложили разворот, а я не посмотрел.
В Вашем случае все просто.
Поставьте на закладке Book списки Page width и Page Height в значение Fixed, а потом переобработайте только все зоны, как я описал выше.
Если Вы дополнительно обрабатывали тифы с расширением pic в других программах, то предварительно сохраните их в другой директории, а после переобработки зон просто замените ими вновь образовавшиеся тифы.

Всего записей: 7164 | Зарегистр. 14-01-2005 | Отправлено: 12:31 02-07-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Если Вы дополнительно обрабатывали тифы с расширением pic в других программах, то предварительно сохраните их в другой директории, а после переобработки зон просто замените ими вновь образовавшиеся тифы.

Да обрабатывал с помощью Microsoft Picture Manager прямо в папке out - они там и сохранялись обработанные picture zones. Ну сохраню в другю папку эти picture zones - затем сделаю как Вы описали выше в ScanKromsator с зонами (fixed и обработать). Затем верну (заменю те, что были picture zones с папки куда перекинул временно). НО. у меня же они не заменятся на самих страницах - чтобы был текст на странице и НОВАЯ (обработанная картинка с помощью Microsoft Picture Manager) чтобы именно они встали на страницы обработанные после ScanKromsator.  
 

Цитата:
СК сам умеет делать djvu,

Я это делаю в LizardTech Document Express Enterprise 5.1 - яд умаю он создан специально для кодирования и качество будет лучше - сорри - я не преуменьшаю Ваших заслуг. Но думаю, для перевода в DjVu лучше пользоваться уже специально заточенным для этого продуктом.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3538 | Зарегистр. 22-12-2003 | Отправлено: 13:19 02-07-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula

Цитата:
НО. у меня же они не заменятся на самих страницах

После переобработки появится возможность снова их merge
 

Цитата:
Я это делаю в LizardTech Document Express Enterprise 5.1 - яд умаю он создан специально для кодирования и качество будет лучше  

СК именно его и вызывает для создания djvu. Разница в том, что СК берет на себя все действия по подготовке файлов и вызову DEE. Кроме того, для кодирования зон используется МПФ, что на сегодня является наиболее оптимальным методом раздельного кодирования текста и иллюстраций.
Грубо говоря: вы сливаете зоны с текстом, потом DEE автоматически делает обратную операцию (вычленяет текст и фон/картинки), что неизбежно приводит к артефактам в области зон. Налицо ненужная lossy операция, ведь мы и так заранее знаем, где текст, а где зоны, так зачем эту разбивку снова поручать DEE, когда можно самому закодировать текст, зоны и потом объединить в один файл. Причем кодировать текст будем тем же DEE, что действительно является наилучшим. Такое раздельное кодирование и есть метод МПФ
 
Добавлено:

Цитата:
качество будет лучше - сорри - я не преуменьшаю Ваших заслуг

я не настолько глуп, чтобы подменять профессиональный DEE собственными поделками

Всего записей: 4548 | Зарегистр. 09-09-2002 | Отправлено: 14:03 02-07-2014 | Исправлено: bolega, 14:12 02-07-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Я кодирую текст+фото таким способом - My_Scanned600.
Я правда не знаю как можно откодировать отдельно фото и текст - если картинки слиты на странице уже? Я так понимаю если это делать из ScanKromsator - то там отдельно кодируются текст в Bitonal и фото профилем Scannned 600 и затем объединяется в один файл DjVu?

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3538 | Зарегистр. 22-12-2003 | Отправлено: 14:27 02-07-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula

Цитата:
Я правда не знаю как можно откодировать отдельно фото и текст - если картинки слиты на странице уже?

После слития - увы, никак. Это на будущее.

Цитата:
если это делать из ScanKromsator - то там отдельно кодируются текст в Bitonal и фото профилем Scannned 600 и затем объединяется в один файл DjVu?

Текст кодируется не обязательно bitonal, вы сами укажете СК, какой профиль взять из DEE (по умолчанию профиль настроен непосредственно в СК, и он imho оптимальный, можно только изменить по желанию количество страниц в словаре).
Картинки кодируются с помощью djvulibre (ничем не хуже чем DEE), т.к. и в том, и в другом инструменте используется практически одинаковое вейвлет-кодирование. Качество кодирования можно варьировать. Вызов кодировщиков, слияние слоев, раскраску текста (если есть), кодирование и вставку обложек (или цветных вкладок)  СК берет на себя.
СК поддерживает и обычное DEE-кодирование, не раздельное. Но при этом вам не нужно заморачиваться слиянием зон, СК сделает все сам. Более того, можно применять разный способ кодирования для разных страниц.
Правда в текущей публичной версии есть проблемы с утечкой памяти при создании djvu. Проблемы пофиксены в новой версии, которая будет в скором времени доступна.

Всего записей: 4548 | Зарегистр. 09-09-2002 | Отправлено: 15:23 02-07-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Dracula

Цитата:
НО. у меня же они не заменятся на самих страницах - чтобы был текст на странице и НОВАЯ (обработанная картинка с помощью Microsoft Picture Manager) чтобы именно они встали на страницы обработанные после ScanKromsator.

Если после этого снова сделаете объединение, то именно это и произойдет.
Проверьте на любой зоне на любом развороте и сами убедитесь в этом.

Всего записей: 7164 | Зарегистр. 14-01-2005 | Отправлено: 17:45 02-07-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
shch_vg
Ребята огромное Вам спасибо - реально работает. Не пришлось всё заново переделывать. Поставил размер страниц - fixed и обработал picture zone - затем заменил эти зоны в папке "out" на те, что я обработал в графическом редакторе и всё заменилось и в ScanKromsator'e зоны объединились наконец обработанные в графическом редакторе которые.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3538 | Зарегистр. 22-12-2003 | Отправлено: 22:42 02-07-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Маркирую ряд зон в середине книги, меняю параметры обработки и обрабатываю их. После завершения обработки появляется RV первой страницы, а хотелось бы видеть RV страницы, содержащей первую помеченную зону.

Всего записей: 7164 | Зарегистр. 14-01-2005 | Отправлено: 20:27 03-07-2014 | Исправлено: shch_vg, 20:28 03-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Господа,
 
странная ситуация: создаю ПДФ, к моему удивлению - качество текста ухудшается. Незначительно, но неприятно и видно "невооруженным глазом". Может ли кто-либо помочь? С чем это может быть связано?

Всего записей: 379 | Зарегистр. 12-09-2011 | Отправлено: 00:04 14-07-2014 | Исправлено: driver1991, 00:04 14-07-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
driver1991
Было бы странно, если бы качество улучшалось.
Любое преобразование с сжатием заведомо ухудшает качество, весь вопрос - насколько? Я могу так создать пдф, что Вы вообще не различите на нем ничего.
Мораль всего вышесказанного: нужно подробно описать, как Вы создавали пдф.

Всего записей: 7164 | Зарегистр. 14-01-2005 | Отправлено: 01:22 14-07-2014 | Исправлено: shch_vg, 01:22 14-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я не думал, что создание пдф в кромсаторе надо описывать. Вообще-то это достаточно стандартная процедура: создается выводящее задание (create out-task), на закладке "Files" указывается требуемый формат (в моем случае - пдф) и имя файла, далее "Process". На закладке "PDF" можно указать "Page layout" и качество сжатия для цветных или серых страниц (у меня - черно-белый текст без иллюстраций).
 
Если Вы при этом можете черно-белый текст превратить в нечто, на чем ничего не различить - это говорит о высокой квалификации. У меня таких целей нет.
 
Я не делаю никакого сжатия. Для меня странно, что это стало происходить в последние неделю - две, до этого я может быть ничего не замечал, а может быть ухудшений не было.  
 

Всего записей: 379 | Зарегистр. 12-09-2011 | Отправлено: 11:59 14-07-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
driver1991
у вас прочие опции обработки отключены? На закладке Files чему равно DPI и Color? Создание pdf мало чем отличается от обработки файлов, если есть какие-то включенные опции, они будут учтены.

Всего записей: 4548 | Зарегистр. 09-09-2002 | Отправлено: 12:20 14-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
DPI = 600
Color=b/w
Input DPI = auto; сканирую я обычно 300.
 
"Создание pdf мало чем отличается от обработки файлов, если есть какие-то включенные опции, они будут учтены."
 
Учитываются опции только с закладки "Files" или с других закладок тоже?
 
Еще один вопрос. Книга издана недавно, репродукционное или репринтное издание дореволюционной книги. Качество получается невысокое, уже на сканах потери эилементов букв: например, "н" без горизонтальной черты и т. д. Что в этом случае может быть сделано для улучшения? Изменить настройки сканера?

Всего записей: 379 | Зарегистр. 12-09-2011 | Отправлено: 13:13 14-07-2014 | Исправлено: driver1991, 13:20 14-07-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
driver1991
Сделайте subtask на какой-нибудь скан, на котором заметно это ухудшение, и выложите директорию task в архиве на обменник. Заодно добавьте в этот архив Ваш ухудшенный вариант пдф этой страницы.
Насчет сканера могу сказать, что многие из них при работе по умолчанию пытаются сделать какие-то дополнительные обработки создаваемых сканов.
Поэтому на мой взгляд лучше всего сканировать в vuescan в вариант raw, качество которого наиболее приближено к исходному состоянию страницы/разворота.
И, конечно, увеличение дпи сканирования (до 600) даст заведомо нехудший вариант.

Всего записей: 7164 | Зарегистр. 14-01-2005 | Отправлено: 13:34 14-07-2014
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru