Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39225 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
он же писал что купил и отсканировал свой экземпляр.

Всего записей: 3412 | Зарегистр. 15-07-2010 | Отправлено: 22:42 08-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:
Цитата:
он же писал что купил и отсканировал свой экземпляр.

Да. Отсканировал. В 300 DPI.
 

Всего записей: 783 | Зарегистр. 18-05-2023 | Отправлено: 22:47 08-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
тогда мне не очень ясно, о чем вы спросили и главное зачем. подумаешь, внутри 1800дпи. Я на publ.lib.ru показывал с год назад пример переобработки из 300 в 1200 скана из дореволюционной книжки, посканированной в ленинке. Все зависит от того, что хочется обработчику получить из оригинала, а не от чужого игнора.
 
Добавлено:
оффтоп  
да, еще. "субпиксельная фильтрация", судя по интернетным заметкам, не имеет отношения к тому, что я сказал о ФШ. "с.ф." использует свойства пикселей показывающего устройства, если в них цвет создается несколькими светодиодами, К, З, С.

Всего записей: 3412 | Зарегистр. 15-07-2010 | Отправлено: 22:55 08-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral say:
Цитата:
Все зависит от того, что хочется обработчику получить

А для меня всегда важнее, для кого я делаю обработку? Ежели онли для себя, то об ней никто и не узнает. А ежели для читателей, то я не буду делать её тормозной и лагающей без весомой на то причины. А такой причины в данном случае нет. И да, вы действительно не поняли вопроса. Совсем.
 

Всего записей: 783 | Зарегистр. 18-05-2023 | Отправлено: 23:12 08-02-2025
Fire_Dragon



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
уточните, имеются ввиду фильтры только на самой вкладке, без "enhance..." ?  

 
В первую очередь интересуют фильтры как раз из раздела enhance, но, по-хорошему, все.
Суть проблемы: пользователь посредством предпросмотра применяет фильтры к изображению в определённом порядке и активирует необходимые, получая при этом некий результат. Необходимо сохранить этот результат после обработки, а для этого не должно происходить неявного изменения желаемого порядка.
В дополнение к enhance-фильтрам, большое значение имеет момент интерполяции изображения, её порядок тоже очень важен.
 

Цитата:
Есть два варианта: отдельно задать нужную последовательность фильтров, запомнить как набор и присваивать его файлам, т.е. для каждого файла нужно дополнительно просто указать (выбрать) набор (его номер). Второй вариант - задавать последовательность для каждого файла, т.е. каждому фильтру присваивать порядковый номер на каждой странице (или один порядок на все файлы).

 
Типичная схема: расставить галки на нужны фильтры, перенести настройки на некое множество файлов, в идеале - на всё. По сути, когда вариантов комбинаций немного, для экономии места эффективней создавать группу и уже на неё ссылаться. В идеале, нужно закодировать параметр таким образом, чтобы его можно было гибко трактовать как один или другой вариант, а реализовать можно какой проще, для начала.
 

Цитата:
Я с таким не работал, сам не знаю как лучше

Вот это очень интересно, а какова авторская задумка при работе с комбинациями фильтров, если порядок их применения не очевиден для пользователя, ведь наличие предпросмотра является логичной предпосылкой установки конкретной последовательности?
 
Добавлено:

Цитата:
кому как. Мне slava_kry рассказывал (и это вроде есть в его роликах), что очень удобно подымать разрешение с 600 до 2400 или еще выше. Лишь бы машина тянула. Обработка фильтрами в ФШ проходит куда легче и результат лучше. Потом downsampling, конечно.
 

Здесь вопрос, много ли смысла в подобных манипуляциях, есть ли какой-либо объективный анализ по итоговому результату или это всё плацебо. Мои эксперименты показывают что чудесным образом плохой материал не улучшишь, а для хорошего, это излишняя трата ресурсов. Высокое разрешение, такое как 1200dpi, очень полезно для фильтров сглаживания, особенно если есть намерения прогнать материал через Adobe ClearScan.

Всего записей: 35 | Зарегистр. 19-11-2010 | Отправлено: 23:12 08-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп, последний раз

Цитата:
zvezdochiot
А ежели для читателей, то я не буду делать её тормозной и лагающей без весомой на то причины. А такой причины в данном случае нет.

Обработчик не может сделать одну книгу для 8 млрд жителей планеты. У них противоречивые условия просмотра. Очередной бред, иначе говоря. Отталкиваться следует от физиологии тела, общей для биологического вида, и устройства преобразующих систем мозга, тоже одинаково у всех работающих.

Всего записей: 3412 | Зарегистр. 15-07-2010 | Отправлено: 23:29 08-02-2025
Fire_Dragon



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Товарищи!
Кто-нибудь сталкивался с невозможностью создания djvu файлов в documenttodjvum из-за ошибки:  

Цитата:
 
Ошибка: [1-10000] Неопознанное сообщение об ошибке:
        Имя сообщения: Unknown Error..
 

Она возникает при работе с ч/б изображениями в которых изображения закодированы множеством мелких точек - фильтр есть такой. Возникает, по-видимому, из-за преодоления ограничения на размер некой внутренней структуры.
Если есть у кого возможность проверить вот ссылка на пример картинки:
 
Данная ошибка зафиксирована в следующих программах:
documenttodjvum [1-24114] sdk версия 5.0.0.973
Document Express Editor 6.0.1 Build 1320
 
Интересуют способы преодоления. Известными способами являются: изменение dpi изображения, или указание параметра -dpi с числом меньшим оригинальному dpi, причём для каждого изображения оно может быть разным, а также изменение размеров изображения или заливка его частей однородными блоками.

Всего записей: 35 | Зарегистр. 19-11-2010 | Отправлено: 00:28 09-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fire_Dragon say:
Цитата:
Интересуют способы преодоления.

В minidjvu и cjb2 из DjVuLibre никаких ошибок. Закодируй "избранные" страницы ими и присоедини к остальным.
 
PS: А нет такой фитчи, как низкий порог для текста и рамок после чего микс (только чёрное) с дизерингом?

Всего записей: 783 | Зарегистр. 18-05-2023 | Отправлено: 00:38 09-02-2025 | Исправлено: zvezdochiot, 00:44 09-02-2025
Fire_Dragon



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пока так и делаю, но при изменении изображений данная ошибка плавает от одной картинки к другой и чтобы кодировать некоторые страницы отдельно, нужно каждый раз выявлять те что являются сбойными. Вопрос задан дабы не городить костыли, может есть вариант проще.

Всего записей: 35 | Зарегистр. 19-11-2010 | Отправлено: 00:52 09-02-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нашли что обсуждать. 1800 dpi в pdf сделанном в FineReader в теме по СканКромсатору. От весьма известного местного изготовителя файлов.
Этот pdf с его 1800 dpi на jbig2 получен в ФайнРидере нажатием одной кнопки - ОК. С параметрами по умолчанию (на моём ФайнРидере именно так). Могу конечно и ошибаться, и эти параметры выбраны путем длительного анализа проб и ошибок, но что-то мне подсказывает.  
А параметры по умолчанию у ФайнРидера такие:
- Качество изображений - высокое
- Сжимать изображение с помощью MRC - включено
- Применять технологию ABBYY PreciseScan для сглаживания символов - включено
Для ФайнРидера "высокое качество" изображений означает для иллюстраций понижение исходного dpi в 2 раза, в данном случае с 600 до 300. Формат - jpeg2000
Технология ABBYY PreciseScan означает для текста увеличение исходного dpi в 3 раза для jbig2, в данном случае с 600 до 1800. Если снять птичку на этом пункте, то текст в jbig2 будет 600 dpi. Фон - 300 dpi jpeg2000.
В ФайнРидере можно выставлять только уровень качества, а dpi и формат изображений подставляются под заданное качество согласно разумению программистов АББИИ.
 
zvezdochiot
pt - это сокращенное обозначение типографского пункта, который является мерой длины и равен 1/72 дюйма. Такие дела.

Всего записей: 899 | Зарегистр. 04-11-2019 | Отправлено: 00:52 09-02-2025
Fire_Dragon



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кстати, а нет ли фильтра анти-дизеринг? Чтобы получать из этих точек заливку серого цвета.
К слову говоря, рекомендую не злоупотреблять фильтром дизеринга, поскольку размер результата может получаться гораздо больше чем при малоцветном кодировании, конечно, это может потребовать больше усилий на обработку, особенно при большом количестве иллюстраций.

Всего записей: 35 | Зарегистр. 19-11-2010 | Отправлено: 01:00 09-02-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
есть у кого возможность проверить вот ссылка на пример картинки:

не самый лучший метод - передавать серый фон таким плотным дизерингом. Нужно либо "разжижать" (осветлять) перед дизерингом, либо сделать inverse dithering в СК:
https://workupload.com/file/ArsmywY9vNW

Всего записей: 4622 | Зарегистр. 09-09-2002 | Отправлено: 01:01 09-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fire_Dragon say:
Цитата:
Кстати, а нет ли фильтра анти-дизеринг? Чтобы получать из этих точек заливку серого цвета.

Есть. Но мыло будет ещё то. А вот результат не очень, не очень чтобы прям серое изображение, скорее с разводами: pixam: manual.
 
 

Всего записей: 783 | Зарегистр. 18-05-2023 | Отправлено: 01:13 09-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
не самый лучший метод

мы с вами очень давно вели переписку по применению дизеринга, и сошлись во мнении, что он в 99,9% не нужен. По нынешнему опыту - что-то изменилось в оценке?
 
Меня больше напрягает когда он есть на оригинале. Типа такого:
https://drive.google.com/file/d/1_VEHGrgXf7hJi7YSrAuCcjUqM2JPC7JH/view?usp=sharing

Всего записей: 3412 | Зарегистр. 15-07-2010 | Отправлено: 08:45 09-02-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
По нынешнему опыту - что-то изменилось в оценке?  

не изменилось.
Но человек спросил что делать, я показал как работает анти-дизеринг в СК через соответствующую опцию в зоне.
 
Добавлено:
Fire_Dragon

Цитата:
Вот это очень интересно, а какова авторская задумка при работе с комбинациями фильтров, если порядок их применения не очевиден для пользователя, ведь наличие предпросмотра является логичной предпосылкой установки конкретной последовательности?  

то, что вы описали выше (подбор последовательности фильтров) - это задача не для СК, никто не запрещает сделать это в виде сценария в ФШ, гимпе и т.п. и это будет быстрее и качественнее, чем в СК. Если позволить это в СК, то он превратится в обычный кастомный графический редактор, я этого не планировал. Я подобрал оптимальную последовательность фильтров для большинства случаев, если возложить эту задачу на плечи пользователей, то СК вообще не будут пользоваться. Кроме того, как я уже отвечал вам, на гибкость применения опций оказывает влияние наличие зон, т.е. их наличие ограничивает эту гибкость.
 
По поводу preview вы правы, это как правило недостоверный preview, и я об этом не раз писал. Но для кого-то это давало хоть какое-то представление что будет делать фильтр, ведь многие не сильно разбираются в этом. Но в принципе я готов в новой версии убрать все кнопки preview (за исключением иллюминации и фона), чтобы не вводить никого в заблуждение. Наверно, так и сделаю.
В зонах preview оставлю, т.к. там оно работает довольно близко к тому, что будет после обработки, за исключением некоторых опций.

Всего записей: 4622 | Зарегистр. 09-09-2002 | Отправлено: 09:36 09-02-2025 | Исправлено: bolega, 09:56 09-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
готов в новой версии убрать все кнопки preview

ой, не надо. я частенько смотрю на силу установленного фильтра, кручу параметры. Ну нафиг настроить пяток  фильтров вслепую и ждать пока СК прожует скан в 1200. В превьюшке все моментально видно.

Всего записей: 3412 | Зарегистр. 15-07-2010 | Отправлено: 10:58 09-02-2025
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Fire_Dragon если хочется совсем маленького файла, то заливки зон вам помогут https://workupload.com/file/En8Fy4hc2Wh
TelecomUral  

Цитата:
Меня больше напрягает когда он есть на оригинале

Я для таких случаев тоже использую заливку, плюс фильтр удаления растра (descreen), теоретически, если не устраивает как чистит фильтр в кромсаторе, можно использовать другие программы, а потом уже обрабатывать без растра (не факт, что выйдет лучше)
https://workupload.com/file/Cbn2SvbVp94

Всего записей: 793 | Зарегистр. 03-07-2005 | Отправлено: 11:10 09-02-2025 | Исправлено: bearjrgm, 11:11 09-02-2025
Fire_Dragon



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но в принципе я готов в новой версии убрать все кнопки preview (за исключением иллюминации и фона), чтобы не вводить никого в заблуждение.

 
Убирать предпросмотр как раз не следует, это только снизит возможность понимания работы, что усложнит использование СК. Проще сделать отключаемое сообщение с предупреждением при использовании одновременно нескольких фильтров: что это не то чем может казаться. А сообщение: "Options successfully applied!", появляющееся при смене профиля, возможно, следует убрать или сделать его всплывающим и не требующим пользовательской активности; чрезмерное кликанье на подобных окнах раздражает со временем.

Всего записей: 35 | Зарегистр. 19-11-2010 | Отправлено: 22:45 10-02-2025
Fire_Dragon



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bearjrgm
 
А можно посмотреть на файл задания где осуществлена заливка зон? В принципе, я тоже так делаю, но у меня шагов получается больше чем хотелось бы.

Всего записей: 35 | Зарегистр. 19-11-2010 | Отправлено: 19:51 11-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Может быть, лучше сделать дополнительно такой хитрый "превью" как полная обработка но для выбранного крошечного кусочка скана? Не более, допустим, квадратного дюйма конечного размера. Пара-тройка строк шрифта или меньше. Или не имеет смысла? Я вот для сложных сканов именно так и поступаю. Выбираю на глаз проблемный участок, и только на него в превью и смотрю. Устроил превью, тогда жму "обработай одну страницу" и уже разглядываю ее "с лупой" в VR, начиная с проблемного участка. Если ОК весь лист, тогда размножаю настройки на книгу.
Профилям не верю.

Всего записей: 3412 | Зарегистр. 15-07-2010 | Отправлено: 20:00 11-02-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru