Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39130 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 17:04 07-10-2024
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, а чуть документировать формат spt вы не могли бы?
Один из участников форума сделал скрипт для СК, который может создавать зоны для цветных (т.е. нечёрных) объектов.
 
После работы скрипта скан выглядит так:
 

 
Вот если бы была какая-то зацепка для для различения зон с разными цветами (скажем, "синяя" зона, "красная" зона), то легче было бы разделить зоны на группы.
То есть красные объекты будут зонами типа Picture группы 1,
синие объекты —  зонами типа Picture группы 2,
и т.д.
 
Но из-за незадокументированности формата spt это сделать проблематично. Так объяснил автор скрипта.
 

Всего записей: 600 | Зарегистр. 04-05-2016 | Отправлено: 12:39 10-06-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
чуть документировать формат spt вы не могли бы?

никаких секретов, но нужно время, а его не хватает.
в планах было сделать импорт описаний зон из внешнего текстового файла с несложной структурой. но руки еще не дошли.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 13:25 10-06-2024
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
внешнего текстового файла с несложной структурой

 
Что-то типа xml? Это было бы здорово, конечно. Спасибо за ответ!

Всего записей: 600 | Зарегистр. 04-05-2016 | Отправлено: 13:34 10-06-2024
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
планирую, возможно, сделаю доступным команды добавления гиперлинков

Это будет прекрасным решением. Ждем!

Всего записей: 1859 | Зарегистр. 15-06-2006 | Отправлено: 15:41 10-06-2024 | Исправлено: Benoni, 17:31 10-06-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
asku

Цитата:
Вот если бы была какая-то зацепка для для различения зон с разными цветами

А причем здесь СК, если принадлежность к группе должна определяться на стадии создания зоны, т.е. именно скриптом?
Если же скрипт способен различить цвет текста в создаваемой зоне, то присвоить ей индекс не так уж сложно.

Всего записей: 7189 | Зарегистр. 14-01-2005 | Отправлено: 18:33 10-06-2024 | Исправлено: shch_vg, 18:40 10-06-2024
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg, ну в spt-файле же разбираться нужно?) Вписывать сведения о зонах нужно туда. А в каком месте там конкретно хранятся сведения об индексе групп неизвестно автору скрипта. Он мне так объяснил.

Всего записей: 600 | Зарегистр. 04-05-2016 | Отправлено: 18:42 10-06-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega say:

Цитата:
Да, правится именно трапеция, дугообразные (т.е. не прямые) завороты строчек - нужен совсем другой алгоритм, с детекцией базисных строк и т.д. В СК такого нет,

Тогда вам стоит посмотреть на одномерный (вертикальный) ручной DeWarping в PhotoQuick. Он имеет очень простую математику, из-за одномерности не приводит к разрывам и за счёт использования помимо прямых линий ещё и сплайнов Акимы позволит вам очень даже плавно выпрямлять изображения. Ну а понадобится двухмерный DeWarping, так в демке к PhotoQuick показано, что это просто два одномерных деварпинга с поворотом на 90 градусов. Такие вот дела.
 

Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 19:08 10-06-2024 | Исправлено: zvezdochiot, 19:09 10-06-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
asku
Но из-за незадокументированности формата spt это сделать проблематично

если вам нужно найти конкретное место сохранения конкретного параметра, можно было сравнить два задания, отличающиеся только этим параметром.
Насколько я смог подсчитать, это 48й параметр блока X2. Группа 1я - параметр равен нулю, группа 2я - единице.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 07:31 11-06-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вот, опять встретил серый растровый шрифт.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 11:09 11-06-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чуваки, мощно задвигающие и раздвигающие!
 
Можете качать желанную Хрестоматию версии 2.1 с этого адреса: https://workupload.com/file/ejfBxzFUVFd
Изучая её каждый день понемногу, будете толковыми чуваками, грамотно использующими SK. Особенно её полезно перечитывать после того, как вы получили определённые навыки работы с программой. Тогда вам будут открываться те моменты, ранее казавшиеся вам непонятными или просто незамеченными.
 
bolega

Цитата:
Иначе пришлось бы поворачивать правую половинку, пристыковывать к левой с неизбежной потерей контента в центре.  
https://workupload.com/file/pWCnfEB2Um4  

С удовольствием изучил Ваше задание, особенно настройки, и стало всё понятно. Собирая Ваши примеры подобного рода, по сути, получается замечательная наглядная Хрестоматия.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 11:43 11-06-2024 | Исправлено: zbolv, 11:46 11-06-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
asku

Цитата:
в каком месте там конкретно хранятся сведения об индексе групп неизвестно автору скрипта.

Это естественно, т.к. он не работает в СК. А вы сами не можете это сделать и подсказать ему? Нужны подсказки, пишите в ЛЯ.

Всего записей: 7189 | Зарегистр. 14-01-2005 | Отправлено: 12:55 11-06-2024 | Исправлено: shch_vg, 13:10 11-06-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Нужны подсказки, пишите в ЛЯ.

А почему такая секретность? Другие тоже хотят это всё узнать, ведь для этого и существует форум! А вы, чуваки, разбредаетесь по углам и шепчетесь, а такое поведение мерзостное, в порядочном обществе так себя не ведут.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 13:06 11-06-2024 | Исправлено: zbolv, 13:08 11-06-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
zbolv

Цитата:
А почему такая секретность?

Чтобы меньше дурацких вопросов к автору программы было в этой теме.  
Каждый научившийся запускать СК будет лазить в файл spt, править, ничего в нем не понимая, а потом задавать эти самые дурацкие вопросы.
В данном случае идет конретный разговор о конкретном параметре, чтобы подсказать автору скрипта, не работающему в СК, где находится нужная ему информация.

Всего записей: 7189 | Зарегистр. 14-01-2005 | Отправлено: 13:20 11-06-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
Чтобы меньше дурацких вопросов к автору программы было в этой теме.  

А как же быть с теми, кто хочет изучать, не задавая дурацких вопросов? И может быть в таких случаях следует прямо предупреждать людей об осторожности, и не беспокоить автора при этом, тем более, что при экспериментах надо советовать людям первоначально сохранять файл до редактирования, чтобы в случае неудачи, просто вернуть его на прежнее место, и никаких дурацких вопросов не будет.
Еще раз повторяю, форум создается для совместного обучения и помощи друг другу, а не выделения одних над другими по типу: элита и плебеи. Словари русского и иностранных языков определяют понятие форума как места выступлений, высказываний, обсуждения.
Стыдно мне за вас!
 

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 14:10 11-06-2024 | Исправлено: zbolv, 15:40 11-06-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А как же быть с теми, кто хочет изучать, не задавая дурацких вопросов?

идти в личку, правильно shch_vg говорит. кому надо, тот инфы добьется.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 14:17 11-06-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
идти в личку, правильно shch_vg говорит. кому надо, тот инфы добьется.  

Прекрасный ответ, дающий отличную характеристику этому форуму!
Посмотрим, что будет с вами далее...
Если после этих маленьких дебатов меня забанят окончательно, - не расстроюсь!!!
Модератор, вперёд!!!

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 14:37 11-06-2024 | Исправлено: zbolv, 14:38 11-06-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Вопрос
Если поставить на странице с типом бинаризации autoW b/w-zone (чтобы подправить в одном месте слишком большую бледность чертежа, которую метод почему-то не вытянул), но threshold бинаризации этой зоны не задавать (галка снята, а метод стоит Smooth) - то правильно ли, что зона вообще стала чистенькой? Пусто на обработанной странице в её месте. Раньше, до использования мной метода Вольфа, я такого поведения не замечал, можно было спокойно играться с такими зонами, галку снимешь - как будто её, зоны, и нет.
задание: https://disk.yandex.ru/d/WzAT5W6QUHsi8A

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 20:04 11-06-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Если поставить на странице с типом бинаризации autoW b/w-zone

такого я не предусматривал. Получился по сути баг.
Более того, наличие включенной b/w-zone сильно влияет на результат работы autoW, что само по себе не хорошо.
придется это как-то исправлять.
 

Цитата:
которую метод почему-то не вытянул

уберите b/w-зону и увеличьте sensivity c 5 до 8, тогда вроде вытягивает

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 08:49 12-06-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
такого я не предусматривал. Получился по сути баг.  
Более того, наличие включенной b/w-zone сильно влияет на результат работы autoW, что само по себе не хорошо.  
придется это как-то исправлять.  


Цитата:
уберите b/w-зону и увеличьте sensivity c 5 до 8, тогда вроде вытягивает

 
Прекрасное задание предложил TelecomUral   https://disk.yandex.ru/d/WzAT5W6QUHsi8A  
Я проанализировал его с учетом Ваших предложений и получил такой результат, что если выделять эту схему в pic-zone с b/w профилем, используя бинаризацию Волка, установив чувствительность на 8, включив диспекл и шарпен, не отключив при этом в общих настройках бинаризации Волка, то результат получается лучше, чем если бинаризировать ее целиком без выделения в зону с Волком и чувствительностью 8, как предложили Вы.
Я задания сохранил в случае с зоной под именем mine1, а без зоны – mine2. Все выложил по адресу: https://workupload.com/file/6CYw2bstxSQ , если кому интересно.
 
Добавлено:
И еще, пожалуйста, разъясните, чем отличается порог от чувствительности в Волке? И последнее на сегодня, менял размер в Волке окна со 100 до 50 и до 150 и никакого эффекта не обнаружил. Как это понимать?

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 10:42 12-06-2024 | Исправлено: zbolv, 10:49 12-06-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zbolv

Цитата:
чем отличается порог от чувствительности в Волке?  

уточните, о каком пороге идет речь. Есть коэффициент чувствительности, размер окна и поправка, порога нет.
 

Цитата:
окна со 100 до 50 и до 150 и никакого эффекта не обнаружил

наверно, надо читать первоисточник алгоритма
https://chriswolfvision.github.io/www/software/binarize/index.html (там ссылка на статью).
В примере TelecomUral фон довольно равномерный, поэтому размер окна роли не играет.  
В теории, Вольф применяется для неравномерных и слабоконтрастных сканов. В прочих случаях алгоритм не дает особых преимуществ.
А параметр-чувствительность, грубо говоря, это аналог контраста. Чем выше, тем лучше контраст, и лучше разделение на фон/текст для бледных сканов.
 
 
 
 

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 16:29 12-06-2024 | Исправлено: bolega, 10:57 13-06-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru