Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39130 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 17:04 07-10-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
если в режиме правки зон в VR щелкнуть ПКМ на превьюшке зоны, будет пункт "открыть во внешнем редакторе". И ошибка. Хотя ирфан в опциях настроен, и вызывается через ПКМ на области самой зоны и "special...".

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 12:44 07-08-2024
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Да и в "ложную информацию" я сильно сомневаюсь.

Из приведенных мной сообщений из лога именно это и следует.
При создании дежаву претензии именно к 155 тифу, а дежавуирование отдельно этого скана проходит нормально. После это методом поиска удалось найти, что именно так DEE реагирует на 159 тиф, у которого и был метод сжатия ZIP compr.
Разве это не ложная информация в первом случае?
Далее все более интересно.
Продолжал работать, занимаясь другими делами, не связанными с созданием дежавю, систему не перезагружал.
В конце дня вернулся к проверке создания нужного дежавю, который благополучно получился, как и дежавуирование проблемного 159 тифа, поэтому я списал все это на выбрыки операционной системы, м.б. проблемы с памятью, т.к. параллельно были задействованы множество процессов.
Проверил сейчас и сделал дежавю 159 тифа - все нормально.
Тема закрыта.
 
zbolv
Не рекомендую вставлять невпопад свои три копейки всюду и привязывать свои проблемы к появляющимся у других пользователей.

Всего записей: 7189 | Зарегистр. 14-01-2005 | Отправлено: 13:19 07-08-2024 | Исправлено: shch_vg, 13:24 07-08-2024
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день. Прошу подсказать.
 

 
Пропадают горизонтальные линии колонтитула при обработке. Какую опцию исключить, чтобы это не происходило?
Спасибо.
 
Тест:
Ссылка

Всего записей: 600 | Зарегистр. 04-05-2016 | Отправлено: 13:37 08-08-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
наверное, они бледнее порога. порог 180, а точки 187-211.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 14:17 08-08-2024
Pamparam

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Пропадают горизонтальные линии колонтитула при обработке. Какую опцию исключить, чтобы это не происходило?

Буквально одной опции unsharp хватило. И засечки у букв стали ближе к исходнику.

Всего записей: 1 | Зарегистр. 01-07-2006 | Отправлено: 14:19 08-08-2024 | Исправлено: Pamparam, 14:19 08-08-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
если в режиме правки зон в VR щелкнуть ПКМ на превьюшке зоны, будет пункт "открыть во внешнем редакторе". И ошибка. Хотя ирфан в опциях настроен, и вызывается через ПКМ на области самой зоны и "special...".

в том ПКМ немного другая команда. Она отправляет во внешний редактор _все_ зоны страницы, а не просто текущую. Я пересмотрел код, багов так и не нашел. Что за ошибка, не понятно, сколько зон в ленте - тоже неясно, параметры Zones > external bult editing не приведены.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 19:12 08-08-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
параметры Zones > external bult editing

а этого не было в whatsnew... или было...
теперь понятно - у меня там пусто.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 19:17 08-08-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
теперь понятно - у меня там пусто.

эта штатная ситуация. В этом случае СК должен выдать просто предупреждение. Но вы упоминали про ошибку, или приняли предупреждение за ошибку
 
Добавлено:

Цитата:
этого не было в whatsnew... или было...

не помню. вроде было.
но признаюсь, я больше не веду whatsnew.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 19:36 08-08-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
да, принял предупреждение за ошибку. Было написано что не сконфигурировано вызываемое приложение, я не сообразил что есть особый параметр в опциях. Думал выберется либо первый редактор из возможных, либо будет окно с выбором.
 
Добавлено:

Цитата:
но признаюсь, я больше не веду whatsnew.

тогда разумно опубликовать исходники.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 19:39 08-08-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
больше не веду whatsnew

просто сейчас нет необходимости. исправляю потихоньку баги. Новое если и будет, то нескоро.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 19:45 08-08-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ясно.
а вы придумали интерфейс к гиперссылкам?

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 19:48 08-08-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а вы придумали интерфейс к гиперссылкам?

более-менее. но еще не все. но зато закончил с поддержкой outlines/bookmarks одновременно для djvu и pdf.  
самое сложное - это подстановочные гиперссылки. тут еще я даже не все варианты придумал. реализую по мере того, как сталкиваюсь с различными реальными случаями при обработке. но получается пока очень сложно. Подстановочные - это когда ссылки не на номера страниц, а не некие номера, которые раскиданы по многим страницам. Задача по максимуму автоматизировать их сбор со страниц книги и формирование таблиц подстановки.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 20:03 08-08-2024
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
автоматизировать их сбор со страниц книги и формирование таблиц подстановки

Прекрасно!

Всего записей: 1859 | Зарегистр. 15-06-2006 | Отправлено: 20:05 08-08-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
некие номера, которые раскиданы по многим страницам

да, там такие заморочки всплывают, прям ужас. Я несколько лет отслеживаю в книгах эти ссылочки, и иногда приходил к выводу что разработать автоматику - нереально. Ка-ак вхреначит автор какой-нибудь "изыск"...
Самое непредсказуемое, что попалось - когда нумерация ссылок идет двойная, два потока в одном тексте. Один поток ссылается на сноски в конце данной главы, и он начинается с единицы в каждой главе. Второй поток указывает на сноски в конце книги. И потоки, в общем-то, мало чем различаются, везде арабские цифры. Либо отличие в жирности, либо в скобке/скобках, либо в звездочке.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 20:16 08-08-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 ссылается на сноски в конце данной главы, и он начинается с единицы в каждой главе

это я предусмотрел. подстановки группами, в каждой главе может быть своя группа и начинаться с 1.

Цитата:
Либо отличие в жирности, либо в скобке/скобках, либо в звездочке.

когда кроме номера, есть другой признак - это очень хорошо. Я приладил функционал Find основного задания для поиска этих ссылок, и если есть доп. признак - это сужает результат поиска, что и требуется. Потом результат Find можно через clipboard перекинуть в out-задание, где анализатор уже знает как интерпретировать найденное и превратить его в таблицу подстановок. Сложности начинаются когда из-за ошибок ocr не все номера находятся или они с ошибками. К примеру, Find уже с версии 6.99 умеет искать возрастающую последовательность ссылок, но если какая-то ссылка не распозналась (а ссылки в виде мелких надстрочных цифр часто идут с ошибками либо вообще не распознаются), то следующая по номеру ссылка может быть взята аж со следующей главы (это когда нумерация в каждой главе начинается с 1, а не сквозная)  и тогда вся автоматизация никуда не годится.  

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 20:30 08-08-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
в виде мелких надстрочных цифр часто идут с ошибками либо вообще не распознаются

ну, это-то мелочь. Контроль предусмотреть, на его основе ручная правка ocr. Если фича группировки существует (ограничение поиска на совокупности страниц "от - до"), то это случай несложный.
 
upd
другой коленкор что для работы всей этой системы требуется вести визуальное структурирование - вот где сложность. Куда в интерфейсе встроить структуру документа.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 20:36 08-08-2024 | Исправлено: TelecomUral, 20:44 08-08-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
для работы всей этой системы требуется вести визуальное структурирование - вот где сложность.

о чем и речь. зайдите в Find, на закладке options включите find increasing numbers и посмотрите как изменятся кнопки поиска. ничего умнее не придумал.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 20:51 08-08-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
посмотрите как изменятся кнопки поиска

это на "1 + Find" ?  
А что, не так уж и плохо.
 
Я-то помасштабнее нафантазировал насчет структуры. Если уж вы так подробно разработали фичи библиотек глифов, с перетаскиванием листков, связками с ocr-возможностями и тэ дэ, то и в работе со ссылками можно было бы несколько усложнить анализ. Создать список потоков, дать каждому назначаемые свойства, типа ограничений страниц, ограничений на find, кнопки контроля, и в конкретный карман потока засовывать результат поиска ссылок данного потока. А потом, как списки выверены, переход в модуль генерации гиперссылок.
 
Кстати, отличная идея искать внутри/вовне aux-прямоугольника. Никто ж не мешает поставить соответствующую зону "ссылка" еще на исходнике.
 
upd
список потоков можно было бы выверять как в уже имевшемся редакторе от v5.94 - щелкаешь по списку, в соседнем окне прыгают превьюшки. на превьюшках подсвечено место сноски. Удобнее бы было вообще пару превьюшек "откуда" и "куда".
Конечно, для 98% книг это суперзамороченно. Но на оставшиеся проценты иначе никак. Либо их сознательно игнорить.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 21:05 08-08-2024 | Исправлено: TelecomUral, 09:28 09-08-2024
sergiokapone



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, как можно закодировать в малоцвет в SK  
это задание

Всего записей: 597 | Зарегистр. 07-06-2011 | Отправлено: 14:59 09-08-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sergiokapone
делаете out-task. В нем идете в визард, attach auto, скан привяжется к step1, переключаетесь на закладку step1, включаете опции FC и max colours = 3, остальное не трогать. Запускаете кодирование, получаете bw djvu с раскраской.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 15:22 09-08-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru