Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть [?] | 2 часть [?] | 3 часть [?] | 4 часть [?]

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка [?]  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 [?] |к v6.8 [?] | к v6.75 [?]
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка [?].
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее... [?]
 

Новое в 6-й версии [?]
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов) [?]
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги [?]
Парсер    версия 2.3.1 из ветки утилит NME [?]
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... [?] | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее... [?]


О Хрестоматии 2.1 SK  [?]
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...  [?]
И ещё bolega о том же самом... [?]  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ [?].

Всего записей: 39352 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, экспериментирую с Set page area. Что-то с размерами страниц после финализации не получается. Вы не могли бы посмотреть?
Ссылка

Всего записей: 635 | Зарегистр. 04-05-2016 | Отправлено: 01:25 17-11-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
в profiles\documenttodjvu.conf нужно везде прописать
render-size=0
Но от удаления совсем мелких точек в режиме lossy это не спасет.  

 
Да, это не помогло.  
Пошёл следующими путями:
 
А) Раскрасил СК-тиффы в красный и подложил фонами под  джву-тиффы. Далее ищу глазами, где красный просвечивает. (Честно говоря, риск что-то не заметить огромный, глаз быстро замыливается).  
UPDATE подложил в FSD, так как много раз просил сделать в СК накидывание битмапов из одного каталога пакетом поверх страниц из другого, но этого нет. Только для одной странички такое возможно, но не пакетом.  
 
Б)  ИмаджМэджик может сравнить картинки и раскрасить красным разницу. А вот дальше так. (На тестовом файле сработало, для пакета будет батник). Постеризатор СТ-адвансед заливает объекты средним цветом. Т.е. чисто красный остаётся только в обособленных участках (пропадающих точках).   Остальные цвета я вручную волшебной метёлкой  удалю в СК и вуаля - у меня в красном останутся только потери. А всего остального - никаких букв и т .д. уже не будет.

Всего записей: 1127 | Зарегистр. 13-06-2013 | Отправлено: 07:44 17-11-2024 | Исправлено: daa2013, 07:55 17-11-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
чё-то какие-то сверхнавороты. Ну, была бы книжка в лосслесс не 3,5мб, а 8,5мб. Так это не проблема же.
 
upd
вспомнил, как засекал время на ручное выделение массы однотипных мест. Исходно кажется что легче помереть. Допустим, 350 страниц в книге, на страницах в произвольных местах некрупные однотонные вставки. И их реально много, иногда до 5-7 на странице, и более. По факту оказывается что каких-то двадцать пять минут сосредоточенного труда и вуаля, все нужные объекты вручную выделены и вопрос закрыт.
Резюме. Вам было не проще так же вручную выделить все формулы - ?

Всего записей: 3499 | Зарегистр. 15-07-2010 | Отправлено: 08:15 17-11-2024 | Исправлено: TelecomUral, 08:22 17-11-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Там, гадство, внутри текста они есть
 
 

Всего записей: 1127 | Зарегистр. 13-06-2013 | Отправлено: 09:24 17-11-2024
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
А я делал каталоги марок!

Всего записей: 3690 | Зарегистр. 22-03-2005 | Отправлено: 09:24 17-11-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Расставляю в СК 7   спецзоны кодирования в оут-таске.
Пытаюсь для контроля вызвать репорт "Zones at page" , пишет  "Not implemented".
 
Хотелось бы, чтобы был применим.

Всего записей: 1127 | Зарегистр. 13-06-2013 | Отправлено: 09:59 17-11-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Там, гадство, внутри текста они есть

засада
 
А если в 1200 закодить?

Всего записей: 3499 | Зарегистр. 15-07-2010 | Отправлено: 10:28 17-11-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
посмотрел. обычно там, где рамки, спецполя все должны быть 0. у вас же к рамкам добавляются поля.

Всего записей: 4669 | Зарегистр. 09-09-2002 | Отправлено: 21:55 17-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
обычно там, где рамки, спецполя все должны быть 0. у вас же к рамкам добавляются поля.

 
А, понял!
 
А почему на последней странице (на той, где фото есть) у меня серый фон пропал? Вроде зону на всю страницу (я именно про зону, а не про рамку сейчас) такую же, как и на двух предыдущих страницах.

Всего записей: 635 | Зарегистр. 04-05-2016 | Отправлено: 22:52 17-11-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
меня серый фон пропал?

так понятно, что пропал. Раскрашивается то, что черное. А бинаризатор фон забелил, т.к. там есть еще картинка, он под нее подстроился. Нужно auto поменять на custom=180 и после обработки всю страницу закрасить черным. А вот номер страницы и надписи в таком случае делать отдельными зонами, как в моем примере. А то они могут стать не видны в djvu. Можно конечно с помощью опции add trasparency mask from image их сделать видимыми, но я не помню, сработает ли это  в версии 7.0.

Всего записей: 4669 | Зарегистр. 09-09-2002 | Отправлено: 08:04 18-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Прошу помочь с маленькой проблемкой.
При обработке в СК исчезают некоторые маленькие точки (знаки пунктуации):

 
Какую опцию подправить?
 
test

Всего записей: 635 | Зарегистр. 04-05-2016 | Отправлено: 13:37 19-11-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Какую опцию подправить?  


Всего записей: 3499 | Зарегистр. 15-07-2010 | Отправлено: 13:59 19-11-2024
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral, отлично. Спасибо!

Всего записей: 635 | Зарегистр. 04-05-2016 | Отправлено: 14:07 19-11-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
Возникла некая идея/хотелка, которой хочу поделиться.
 
Заключается она в следующем:
Выполняю глифирование в книжке с непропечатками. Иногда буквы плохо ловятся, иногда FR с координатами букв промахивался. В другой книжке с формулами часто углы скобок опознавались как "Г", "Т" и даже "m". Ещё там потёки краски за края букв выступали. Как правило, я глифы вкливал, но вот где были сильные потёки, там заменял.
 
Ловится это отслеживанием красного и синего в превьюшке, но часто получается так, что при ранжировании по степени соответствия эти буквы оказываются в середине списка.  
 
Идея заключается в следующем: сделать для кнопки "Sort by matching rating"  по ПКМ или выпадающим списком по аналогии, как для кнопки Apply all сделано,  ещё несколько ранжирований.  
 
По максимуму синих ошибок, по максимуму красных ошибок, а также, как мне кажется,  
(для отлавливания букв с некорректными FR-границами или букв, некорректно посаженных в центр формул) с обсчётом индекса соответствия в некоторой зоне FR-координаты + некий контур.    
Но тут, конечно, поэкспериментировать придётся. Как вариант, задать условия на этот контур в опциях, вот и станет видно, будет это срабатывать как детектор или нет.
 
UPDATE2. То есть, если на границе ячейки буквы из буквы что-то торчит, то возможно граница определена неправильно.

Всего записей: 1127 | Зарегистр. 13-06-2013 | Отправлено: 08:44 20-11-2024 | Исправлено: daa2013, 16:53 20-11-2024
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Еще пара соображений.
 
1.
глифы я иногда вклеиваю (в режиме прозрачности), иногда вставляю (т.е. без прозрачности полностью заменяю букву). Зависит от яркости/пропечатанности исходника. В принципе не проблема. Я копирую закладку , перевожу всё в прозрачность, и когда надо, туда переключаюсь.
 
Иногда на закладке у меня есть микс из прозрачных.непрозрачных букв. Но недавно у меня для книги сформировалось 18 закладок и я в них путался.  Можно ли сделать ли какой-нибудь модификатор, чтобы вне зависимости от назначенной прозрачности/непрозрачности букв  они вставлялялись либо как все прозрачные, либо как все непрозрачные. (Напоминаю, на закладке может быть микс из разных).
 
UPDATE   например, зажимать шифт или контрол при нажатии мышкой на кнопки apply all  / apply selected
 
 
2. Возможно уже писал. Но точно не помню.
На закладке Edit OCRed word   можно ли сделать некий индикатор   РУС/ЛАТ/MIX  
в слове только русские, латинские (=нерусские)  или есть буквы из нескольких алфавитов.  
Иногда приходиться вглядываться, а так было бы сразу видно.  
 
 
 
Добавлено:
Ещё там можно цифры как-то подсвечивать. Очень сложно, особенно для шрифта ариал, которым там кажет,  различить   О/0 , З/3  

Всего записей: 1127 | Зарегистр. 13-06-2013 | Отправлено: 13:08 20-11-2024 | Исправлено: daa2013, 13:11 20-11-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Не ожидал получить проблему на прозрачности.
Почему не работает?
Sub-task здесь.

Всего записей: 7248 | Зарегистр. 14-01-2005 | Отправлено: 02:27 21-11-2024 | Исправлено: shch_vg, 16:45 21-11-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
что не работает?
обработать зону не пробовали?
или в постобработке вручную применить прозрачность (F7).

Всего записей: 4669 | Зарегистр. 09-09-2002 | Отправлено: 17:53 21-11-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
в постобработке вручную применить прозрачность (F7)

Это даже не понял, где и как.

Цитата:
обработать зону не пробовали?

Без обработки она не появится в постобработке.
А вот в какой последовательности, я так и не понял, пробовал разные варианты, но безрезультатно.
Мне проще объяснить, что я хотел получить.
Заменил родные диаграммы на красивые (относительно) сделанные зоны 2 и 3.
Выделил в главном окне поверх 3 диаграммы зону, включающую 8 на 8 (217-я зона), обработал ее и хочу теперь убрать вручную все черные поля 217-й зоны, чтобы остались на ней только пары буква+цифра. После этого рассчитывал включить прозрачность на 217, чтобы пробились черные поля 3-й зоны, но этого не происходит.
Что я делаю не так?

Всего записей: 7248 | Зарегистр. 14-01-2005 | Отправлено: 19:04 21-11-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
надо было оставлять буквы на странице а не в зоне.

Всего записей: 3499 | Зарегистр. 15-07-2010 | Отправлено: 19:24 21-11-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
После этого рассчитывал включить прозрачность  

вы включили опцию обработки. Саму обработку после этого выполнили? Или думаете, что раз включили галку - зона сама сделается прозрачной. Нет, так не работает, это опция обработки, а не команда. Если же хотите команду, в постобработке RV выделите зону (или нужный участок на зоне), КМ special > white transparent (hotkey F7), в итоге все что в выделении белое, станет прозрачным

Всего записей: 4669 | Зарегистр. 09-09-2002 | Отправлено: 19:24 21-11-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru