Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39130 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 17:04 07-10-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Это для программиста, который хочет реализовать в своей программе бинаризацию методом вроде Сауволы-Вольф.
 
Для простых пользователей SK/ST там ничего интересного нет.

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 15:26 14-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo

Цитата:
Если нет желания переходить на 64-битное приложение, тогда курите это...
Chungkwong Chan. Memory-efficient and fast implementation of local adaptive binarization methods.
И требование к диким объемам памяти отпадут за ненадобностью.

Угу. Покурил по диагонали. Статья 2019 года коротко описывает преимущества локальной бинаризации - методы Niblack (1985 год), Sauvola (2000 год), Wolf (2002 год) над Otsu (1979 год).
Эти титаны мысли предугадали ограничение памяти в 2 ГБ в далеких 1985, 2000, 2002 годах.
TelecomUral

Цитата:
я не про то, как реализован алгоритм. Я про невозможность распараллеливания зависимых алгоритмов процессов.

Как раз про это. И зачем в данном случае распараллеливать?

Цитата:
Коммерчески да, а технически всё равно очередь последовательных расчётов. Потому что одному куску алгоритма надо знать чего там предыдущий кусок насчитал.

Как раз коммерчески нет, потому что невыгодно - слишком дорого думать.
А технически как раз выгодно - запустите распознавание на Файнридере на 1 ядре и на 4. Или сжатие нескольких файлов на ПДФ-ИксЧейдж Тулз на 1 ядре или на 4. И посмотрите на результат. Это легко - одну галочку поставить. И всё прекрасно распараллеливается - как раз так, как вы описали.
AlVaKo

Цитата:
Это для программиста, который хочет реализовать в своей программе бинаризацию методом вроде Сауволы-Вольф.

Метод бинаризации Вольфа (Wolf) уже реализован и в СканКромсаторе и в СканТейлоре.

Цитата:
Для простых пользователей SK/ST там ничего интересного нет.

Ну да, там нет самого интересного - а на каких именно изображениях лучше применять один метод, а на каких другой? И как настраивать параметры для локальной бинаризации? Кстати, принципиальные ограничения Ниблэка и Сауволы уже давно описаны - поэтому и появился алгоритм Вольфа.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 15:32 14-02-2024 | Исправлено: jourmager, 15:57 14-02-2024
AlVaKo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Метод бинаризации Вольфа (Wolf) уже реализован и в СканКромсаторе и в СканТейлоре.

Я в курсе этого. Я указал на вариант, как можно для их работы запрашивать в 1000 раз меньшие объемы памяти.
 

Цитата:
Кстати, принципиальные ограничения Ниблэка и Сауволы уже давно описаны - поэтому и появился алгоритм Вольфа.
 
Какие ограничения метода-Сауволы снимает метод-Вольфа?  

Всего записей: 57 | Зарегистр. 06-07-2011 | Отправлено: 15:56 14-02-2024 | Исправлено: AlVaKo, 16:02 14-02-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo

Цитата:
Какие ограничения метода-Сауволы снимает метод-Вольфа?

Если вы нашли свою статью, то информацию про недостатки метода Сауволы найдете также легко.
А я просто процитирую Вольфа:
Niblack obtains a rate of 80% of corrected characters. Sauvola’s algorithm, which has been developed to overcome the problems of Niblack, obtains worse results. This comes from the quality of the video frames, where the contrast is not always as high as in document images, and the hypothesis assumed by Sauvola et al. does not hold. Our normalisation contains the advantages of Sauvola’s method without the sensitivity to contrast and grey value range. The results obtained by our method are better than Niblack’s and Sauvola’s.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 16:11 14-02-2024
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlVaKo say:

Цитата:
Chungkwong Chan. Memory-efficient and fast implementation of local adaptive binarization methods.

Ссылочки всё же желательно оставлять:
  • https://ar5iv.labs.arxiv.org/html/1905.13038
  • https://github.com/chungkwong/binarizer
     
    Классная штука. Плюсую.

  • Всего записей: 692 | Зарегистр. 18-05-2023 | Отправлено: 16:24 14-02-2024
    indinc



    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    При работе в программе заметил неудобную особенность а именно в Result view - когда выбираем Fit page, потом делаем увеличения или уменшения зума и выбираем Fit page, он не сработает сразу - а при повторным нажатием. Это также относится и к Fit width и Optimal.

    Всего записей: 31 | Зарегистр. 02-01-2006 | Отправлено: 13:56 16-02-2024
    SVK2I

    BANNED
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    ИМЕНЕМ АЛЛАХА МИЛОСТИВОГО И МИЛОСЕРДНОГО!
     
    Уважаемый bolega!
     
    Вы знаете, что я очень люблю рамочку в версии SK 6.97. Однако, экспериментируя с ней, я пришел к выводу, что её невозможно использовать в случаях, когда сканы имеют разворот на две страницы. При её использовании опция Split на вкладке Page не работает. Т.е. получается, что прекрасную рамочку можно использовать только на сканах одиночных страниц или, когда желаешь разворот двух страниц сделать как одна страницы. Я прав или не прав?
     
    С уважением, поклонник Аллаха Величайшего, благословен Он во всём.

    Всего записей: 92 | Зарегистр. 16-04-2023 | Отправлено: 10:55 17-02-2024 | Исправлено: SVK2I, 11:16 17-02-2024
    bolega

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    SVK2I

    Цитата:
    Т.е. получается, что прекрасную рамочку можно использовать только на сканах одиночных страниц или, когда желаешь разворот двух страниц сделать как одна страницы. Я прав или не прав?

    На скане может быть только одна рамка. Но никто не запрещает иметь по две копии скана в задании. Загрузить сканы, расставить рамку на левой половине. Затем добавить в задание снова все страницы и расставить рамку на правых половинках. Выделить красным все файлы из второй части, затем использовать Cut selected group, стать в нужное место и Paste to every other position. Если промахнулись или с какого-то места порядок сбился из-за пропусков, то не беда, с помощью Rearrange selected можно выделенные файлы (не обязательно подряд идущие) смещать вниз-вверх или перенести в любое место.

    Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 08:07 18-02-2024
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    как я понимаю из описания, возможна альтернатива: пройти разрезать развороты резаками на половинки без изменения цветности, сделать out-task, затем в out-task расставить рамки.

    Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 08:53 18-02-2024
    asku



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Добрый день. Прошу дать ссылку на видео, где рассказывается об обработке вот таких страниц:
     

     
    Рисунки прямо на тексте.
    Помню, что когда-то встретил видео с инструкцией. Но не помню где видел.

    Всего записей: 600 | Зарегистр. 04-05-2016 | Отправлено: 13:40 21-02-2024
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    aaw12_tekst_nad_photo.wmv

    Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 14:49 21-02-2024
    xMARx

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    __Всем привет. Не получается создать .pdf файл с ocr, т.к. СК 6.97 виснет при его создании. Прикладываю тестовое задание с одной страницей. Просмотрел ее и добавил кое-какие символы в распознанный текст.  
    Ссылка на файл
    __Если в версии 6.97 при редактировании распознанного слова (Edit OCRed word), вставить новый символ после данного (Insert char after), нажать на символ на клавиатуре (или вставить из буфера обмена), сдвинуть границы для нового символа и нажать Accept, то новый символ вставиться, но его границы не сдвинуться. Т.е. надо снова нажимать Edit OCRed word и двигать границы нового символа.

    Всего записей: 66 | Зарегистр. 22-06-2009 | Отправлено: 14:58 23-02-2024
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    xMARx
    добавил кое-какие символы

    вероятно именно они и виноваты Так как если распознать с нуля - PDF генерится.

    Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 16:26 23-02-2024
    bolega

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    т.к. за прошедшее время выявилось немало багов, в ближайший месяц постараюсь выложить новую версию СК, ничего нового, только много исправлено.

    Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 12:17 24-02-2024
    TelecomUral

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Запись обучения азам в СК
    https://drive.google.com/file/d/1Loa3O3hIcQxfDxNkBBfK6OwA3MyIuQi6/view?usp=sharing
     
    К сожалению, первый мой ролик (с ютьюба) не заменяет. Всё собираюсь его повторить с нормальным звуком.
     
    upd
    залил запись во ВКонтакте
    https://vk.com/video557963068_456239137

    Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 23:38 24-02-2024 | Исправлено: TelecomUral, 06:27 26-02-2024
    esys

    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
     первый мой ролик

    Ссылку дадите?

    Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 22:20 25-02-2024
    VadimirTT



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    esys
    Смотреть

    Всего записей: 3389 | Зарегистр. 22-03-2005 | Отправлено: 22:54 25-02-2024
    esys

    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Спасибо!

    Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 23:04 25-02-2024
    bolega

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    При работе в программе заметил неудобную особенность а именно в Result view - когда выбираем Fit page, потом делаем увеличения или уменшения зума и выбираем Fit page, он не сработает сразу - а при повторным нажатием.  

    Никакой особенности нет. Fit page - это не команда, а режим. Когда его включаете, страница вписывается в окно. Потом вы увеличиваете масштаб и повторно жмете Fit page, тем самым отключаете режим. Потом еще раз жмете, и снова включаете режим Fit. СК действует полностью в соответствии с вашими действиями. Проблема в том, что вы действуете неверно, для возврата в fit-view нужно не режим перещелкивать, а дать команду Fit image (отдельная кнопка). Команда fit - это не то же, что режим fit.

    Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 20:52 28-02-2024
    indinc



    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Команда fit - это не то же, что режим fit.

    Благадарю bolega за ответ, понял. А я ожидал что зум работает на подобий как в WinDjView или XnView Classic.

    Всего записей: 31 | Зарегистр. 02-01-2006 | Отправлено: 01:48 29-02-2024
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

    Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru