Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть [?] | 2 часть [?] | 3 часть [?] | 4 часть [?]

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка [?]  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 [?] |к v6.8 [?] | к v6.75 [?]
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка [?].
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее... [?]
 

Новое в 6-й версии [?]
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов) [?]
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги [?]
Парсер    версия 2.3.1 из ветки утилит NME [?]
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... [?] | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее... [?]


О Хрестоматии 2.1 SK  [?]
 
Чтобы русифицировать СканКромсатор
В ini-файле в секции Options должен присутствовать параметр LangInt=1. Вернуть в исходный язык: LangInt=0. Пока русифицировано только MW.
 
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...  [?]
И ещё bolega о том же самом... [?]  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ [?].

Всего записей: 39375 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 07:06 04-12-2024
disciple2000

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В предложенных способах получения глифов из ttf есть один недостаток. Глифы, добытые подобным образом, получаются тоньше, чем отсканированный текст. Думаю, результат глобальной замены отсканированного текста на такие глифы никому не понравится.
Есть способ исправить этот недостаток. В ворде к тексту можно применить эффект под названием Контур текста. Этот эффект утолщает буквы, в результате получается глифы практически идентичные по толщине отсканированному тексту. По прилагаемым файлам можете оценить полученный результат (разрешение 600 dpi).  
Глифы получены из шрифта LiteraturnayaC.ttf (есть в свободном доступе). Этот ttf практически идентичен советскому ГОСТ-му шрифту Литературный машинный строкоотливной прямой светлый. Отсканированный текст набран как раз этим шрифтом (из Каталога ручных и машинных шрифтов 1966 года, стр.396).
 
Добавлено:
Текст, замененный на глифы, выглядит, конечно, отлично. Но на мой взгляд в сканкромсаторе осталась одна нерешенная проблема, связанная с глифами - отсутствие возможности автоматического выравнивания глифов по линии шрифта. Об этом уже писали в этой теме. Если буквы скачут по вертикали, глаз за это цепляется, что мешает чтению.  
Как на мой взгляд можно решить эту проблему: нужно ввести при редактировании глифа возможность указывать для него эту самую линию привязки (т.е. место привязки глифа к линии шрифта). Тогда при глобальной замене вставленные глифы можно будет автоматически выровнять по линии шрифта.
Конечно, может я и глупость написал - я ведь не знаю как устроен сканкромсатор. Но так или иначе надеюсь, что bolega захочет и сможет решить эту проблему.

Всего записей: 4 | Зарегистр. 27-10-2024 | Отправлено: 23:44 12-04-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
disciple2000
Проблема привязки не в глифе, проблема в отсутствии самой линии. Из ФР едет координата буквы и ничего больше. А чтобы была линия, надо предварительно выделить буквы в блок. То есть провести анализ. Что вы наанализируете тут:
 

https://disk.yandex.ru/i/zPzq2f_tbKAHCQ
 
Корректировка блоков руками, по-словно? Нафига? Всё это уже умеет ФР и прочие распознавалки.
Если "да не, таблицы не надо" - то кто определит что надо, а что не надо?

Всего записей: 3506 | Зарегистр. 15-07-2010 | Отправлено: 06:47 13-04-2025
disciple2000

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Вы правы в том, что нужно провести анализ, и что нужно выделить буквы в блоки. Объясняю как. Во-первых анализ нужно проводить в момент глобальной замены отсканированного текста на глифы. Во вторых для глифов должна быть задана линия привязки глифа к линии шрифта.
К примеру, в строке отсканированного текста 10 букв. После глобальной замены линии привязки 6 глифов совпали, линия привязки 4-х глифов отличается от 6 глифов на 1 пиксель.
Таким образом, программа проведет линию шрифта по линии привязки 6 глифов, а остальные 4 глифа будут сдвинуты на 1 пиксель и притянуты к вычисленной линии шрифта.
Линии привязки глифов в других строках отсканированного текста отстоят от первой строки далеко, поэтому в анализ линии шрифта для первой строки они не попадают.
Таким образом, буквы для анализа выделяются в блоки по близости линий привязок глифов. К примеру, можно задать, что если линии привязки вставленных глифов отличаются не более чем на 5 пикселей, то их выравнивают между собой. По такой методике анализ выравнивания глифов, в том числе и для вашего примера, можно провести без проблем.

Всего записей: 4 | Зарегистр. 27-10-2024 | Отправлено: 13:59 13-04-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
disciple2000
Это в теории всё красиво. На практике может поломаться линия строки, что важнее, т.к.слово - более важная единица в чтении.
 
Ну и контрпримеры: замокшие волнистые страницы, страницы с заворотом у корешка и еще вот такие чудеса
 

https://disk.yandex.ru/i/E0ru9chULTzv5w
 

Всего записей: 3506 | Зарегистр. 15-07-2010 | Отправлено: 16:11 13-04-2025 | Исправлено: TelecomUral, 16:11 13-04-2025
disciple2000

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
В ваших примерах нет ничего принципиально сложного с точки зрения предложенного мной метода. Ничто не мешает проводить глобальную замену текста на глифы и выравнивание внутри выделенного фрагмента текста. В вашем примере нужно выделить левую колонку текста, провести глобальную замену и выравнивание. Затем то же самое сделать для оставшихся двух колонок. Затем скорее всего получится выровнять текст во всех трех колонках между собой.

Всего записей: 4 | Зарегистр. 27-10-2024 | Отправлено: 18:01 13-04-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
disciple2000
вы, похоже, не поняли меня с самого начала. Нафига заниматься такой поблочной/построковой/а то и пословной ерундой, если вы по сути уничтожаете оригинал - ? Ну загнали скан в распознавалку и моментально получили ровненькие строчки с векторными шрифтами.

Всего записей: 3506 | Зарегистр. 15-07-2010 | Отправлено: 18:09 13-04-2025
disciple2000

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Я как бы тоже за то, чтобы сохранить оригинал. Для этого и делаются глифы, максимально приближенные к отпечаткам литер.
К тому же, во-первых, вас никто не заставляет делать глобальную замену текста скана на глифы. Если вы считаете, что таким образом "сохраняете оригинал", это ваше дело.
Во-вторых, я уже упоминал, что ttf отличается от отсканированного шрифта по крайней мере по толщине, но не только. И ttf есть далеко не для всех книжных шрифтов. У вас не получится "загнав скан в распознавалку" получить результат даже близко похожий на оригинал.
В третьих, оригинал - это книга, напечатанная на бумаге, а обработанный скан предназначен для чтения на экране. Несколько разные вещи для человеческого глаза - не находите?
Ну и в четвертых, самое главное. Буквы в сканах многих книг из-за изношенного оборудования, плохой бумаги и т.д. получаются настолько испорченными, что никакая обработка скана, кроме глобальной замены на глифа не спасает. Читать на экране такой "сохраненный оригинал" мало кому захочется.
По сути глобальная замена отсканированного текста на глифы это то же самое, что идеальный перенос отпечатков литер на бумагу. Как думаете, кто-то из печатников возражал бы, если была бы возможность такого идеального переноса? Так что это "уничтожение оригинала" сугубо ваше мало обоснованное мнение. С моей точки зрения, конечно.

Всего записей: 4 | Зарегистр. 27-10-2024 | Отправлено: 19:35 13-04-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
еще вот такие чудеса  

 
Такое, прежде чем в СК пихать, через БукРесторер прогнать нужно:
https://disk.yandex.ru/i/1xSzUVPO6_dbAA

Всего записей: 1132 | Зарегистр. 13-06-2013 | Отправлено: 07:05 19-04-2025
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013
а сейчас есть версия БукРесторер которая работает на вин11 х64?

Всего записей: 796 | Зарегистр. 03-07-2005 | Отправлено: 10:49 20-04-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а у меня нет win 11,  я Win XP и Win 7  использую

Всего записей: 1132 | Зарегистр. 13-06-2013 | Отправлено: 14:05 20-04-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп про букресторер [?]

Всего записей: 3506 | Зарегистр. 15-07-2010 | Отправлено: 14:26 20-04-2025
zbolv

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

daa2013

Цитата:
Такое, прежде чем в СК пихать, через БукРесторер прогнать нужно

 
bearjrgm

Цитата:
а сейчас есть версия БукРесторер которая работает на вин11 х64?

 
Скачал версию 4.2.1.0 - подлинная от французов. Программа шедевр. FR рядом не стоит по выполнению тех же функций. Я работаю на 2003, эта версия работает превосходно, а портабельная и другие русифицированные - глючат, поэтому я их отбросил. После обработки сканов в этой программе - СК выдаст "суперконфетку"!!!
 
Даю ссылку на сайт откуда скачал, а там сами разбирайтесь: https://i.twirpx.link/file/5652/
 
Да, пока не закрыли меня снова, докончу прошлую мысль. Самым главным в работе с СК – это борьба со спеклами. Если есть хотя бы один спекл – впечатление от книги сильно падает. С этой целью начал пробовать советы bolega. Эффективно, но всё же парочка спеклов на страничке остается. Это мне не понравилось. Начал использовать стандартные советы ТелекомУрала – то же самое. Но вот попался мне последний его совет в этом отношении:  
 
TelecomUral

Цитата:
А надо просто садиться жопой на стул, поудобнее, и пахать.

Строго следуя его совету, я взял свои ягодицы, сел поудобнее на стул и стал пахать. Чудо! Результат потрясающий – ни одного спекла на страничках не остается. Истинно, шедевры конвейером не делаются, как многие здесь хотят, а только вспахиванием ягодицами!

Всего записей: 109 | Зарегистр. 26-03-2024 | Отправлено: 14:21 21-04-2025 | Исправлено: Maz, 16:45 21-04-2025
asku



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega, добрый день.
 
А можно сделать так, чтобы в опциях зоны Transit можно было указать, что out-задании эта зона была растянута (программой, а не мной) на всю страницу?
 

 
 

Всего записей: 636 | Зарегистр. 04-05-2016 | Отправлено: 16:35 25-04-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
То ли баг, то ли фича.
В СК 7.0  при расстановке пикчур-зон в MW можно потянуть за грипы и вывести границы зоны за пределы страницы. (Возможно, потом при обработке она и обрежется.)
Во-первых, я чего-то такого поведения не припомню, во-вторых мне это кажется некорректным.
 
Но если это сделано специально, то было бы любопытно узнать, в каких ситуациях это может пригодиться ?

Всего записей: 1132 | Зарегистр. 13-06-2013 | Отправлено: 06:28 26-04-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
всю жизнь этим пользовался. Резаки обрежут зону, так легче краевые зоны формировать. Я Transit-зону для целей будущей раскраски фона растягиваю сразу - больше чем исходный скан:
 

эта же картинка файлом https://disk.yandex.ru/d/DPdPfk_PBpCesw

Всего записей: 3506 | Зарегистр. 15-07-2010 | Отправлено: 07:05 26-04-2025 | Исправлено: TelecomUral, 07:06 26-04-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я имел в виду другие пределы (пределы изображения, получается):
 
https://disk.yandex.ru/i/OhnZq6ru0YbsfQ
 
UPD  Да, вы пишете, "больше чем исходный скан", но чего-то этого у вас не вижу. Зона стоит по пределам картинки.

Всего записей: 1132 | Зарегистр. 13-06-2013 | Отправлено: 07:21 26-04-2025 | Исправлено: daa2013, 07:25 26-04-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
аа. да, есть эта странность. Так ведь и резаки при масштабировании аж над полосами прокрутки высвечиваются.
Меня наоборот раздражало в ранних СК, что в out-task грипы за пределы изображения не уходят, надо руками утягивать диагональные вершины, чтоб зону в полный лист растянуть.

Всего записей: 3506 | Зарегистр. 15-07-2010 | Отправлено: 07:28 26-04-2025
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Просто тянешь, и ждёшь, что она в край упрётся, а она за край вылезает. Только через КМ корректировать, ну, или мышой сразу точно выставлять, так как если не за грипы, то край при начальной установке является барьером.

Всего записей: 1132 | Зарегистр. 13-06-2013 | Отправлено: 07:30 26-04-2025
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku

Цитата:
А можно сделать так, чтобы в опциях зоны Transit можно было указать, что out-задании эта зона была растянута (программой, а не мной) на всю страницу?

да, сделаю
 
daa2013

Цитата:
То ли баг, то ли фича.  

фича появилась в 6.95 когда были введены frame. Именно для них это требуется, т.к. иначе при их наклоне невозможно с ними нормально работать. При этом перемещать зону за пределы было возможно всегда.

Цитата:
(Возможно, потом при обработке она и обрежется.)  

конечно обрежется. Любая зона независимо от формы обрезается (за исключением внешних pic-зон). Резаками и краями изображения.
См. также описание опции Ext.pic-zones affects the calculation of the page bounds в whatsnew

Всего записей: 4673 | Зарегистр. 09-09-2002 | Отправлено: 09:16 26-04-2025 | Исправлено: bolega, 09:19 26-04-2025
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Подскажите пожалуйста, в out-task можно распространить картинку на все файлы?
 
Например, в исходном файле есть некая декорация на полях, но она с дефектами или выходит за рамки страницы, можно ли взять картинку и поставить ее, но уже в выходном задании?

Всего записей: 796 | Зарегистр. 03-07-2005 | Отправлено: 14:15 26-04-2025
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru