Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39130 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 17:04 07-10-2024
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sovokr

Цитата:
которые затем пропускаю через potrace

Выглядит как альтернатива ClearScan, заброшенного Adobe. Со своими плюсами и минусами. А этот проект тоже не развивается, судя по "Copyright © 2001-2019 Peter Selinger"?
 
Пример страницы в ClearScan - https://workupload.com/archive/UYVRBsmPG4
 
Сообщество книгоделов в целом относится к этой технологии как к баловству, иногда даже опасному и портящему исходный материал. Поиграют и вернутся к jbig2.
 

Цитата:
Иными словами: возможно ли будет векторизовать черно-белый слой PDF, а цветной оставить растровым?

Это возможно в любой программе, которая умеет разделять вывод текста и картинок (без особых заморочек).

Всего записей: 354 | Зарегистр. 10-08-2018 | Отправлено: 17:53 25-07-2024
imwerden

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У файнридера тоже есть сглаживание букв при выводе в пдф. В качественных книгах в итоговом пдф выглядит хорошо. Файл в 2—4 раза больше по размеру. На макинтоше есть трудности с перелистыванием страниц (следующая белая, потом медленно появляется картинка). На виндовс задержек не видел. Однако, если шрифт в книге не очень, или пропечатан не очень, то буквы могут стать не читаемыми. Итог: если напечатано хорошо, то и без сглаживания всё ок, если напечатано плохо, то сглаживание дополнительно портит.

Всего записей: 18 | Зарегистр. 06-06-2014 | Отправлено: 21:46 25-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zbolv
Теперь хотелось бы увидеть работы других чуваков.

последние семь постов от bolega тут http://publ.lib.ru/cgi/forum/YaBB.pl?action=recent

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 08:06 26-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
последние семь постов от bolega тут http://publ.lib.ru/cgi/forum/YaBB.pl?action=recent

Там есть исходных сканы?

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 09:04 26-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys
нет

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 09:06 26-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тогда трудно оценить качество.

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 10:07 26-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys
странно. вам при покупке новой книги требуются рукопись и оригиналы рисунков художника?

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 10:18 26-07-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
странно. вам при покупке новой книги требуются рукопись и оригиналы рисунков художника?

Разве вы еще не поняли, что прибыл величайший эксперт, то ли из палаты весов и мер, то ли из бюро стандартов, то ли из прочих гринвичей. И не на глаз же эстетическое качество книг будут сравнивать (прошлый век однако), сравнение будет производиться попиксельно с эталоном, который будет изготовлен есесно  в эталонной программе. Разница в пикселях будет подсвечиваться, чем больше будет раскраски, тем дальше отстоят мои книги от величайшего эталона.  
Или вы наивно думали, что сегодня есть какой-то другой способ оценки качества электронных книг? ))

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 11:19 26-07-2024 | Исправлено: bolega, 11:20 26-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть опасение, что кто-то сделает лучше?

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 11:25 26-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
странно. вам при покупке новой книги требуются рукопись и оригиналы рисунков художника?

Не знаю, по каким критериям собирался оценивать качество esys, но иногда действительно надо смотреть на оригинал.
Стянул Брэдбери У. Птицы морей, побережий и рек. 1983.Создано bolega scan AAW
Про первое, что бросилось в глаза промолчу, т.к. это явный косяк обработки, причём не единственный такого типа, а вот второе что бросилось в глаза. Неужели в 1983 году было так плохо с офсетной печатью в СССР, что волны и небо на левой странице окрашены в розовый цвет, а на правой - в более-менее естественный цвет.
Про просвечивающие строки и общую нечеткость опять же промолчу, это сейчас не так интересно.
 
Далее, почему мне интересно было бы глянуть оригинал, так это разные поля слева и справа. Тут ясно видно, что на левой верхней странице левое поле равно нулю, на верхней правой странице - правое поле узкое, на левой нижней странице - левое поле широкое.
 
Во избежание криво-разнотолков эти же страницы у оригинала
Как видим, все поля в ноль. Кстати, правая нижняя картинка в оригинале скорее всего всё-таки чёрно-белая, а не псевдо-сепия.
 
Добавлено:
Продолжаем разговор.
Интересно как на сканах - фон страниц тоже разного цвета - белый и синеватого оттенка? Наверное, все уже поняли, что в англоязычном оригинале страницы одного цвета.
 
И ещё - на сканах нижний обрез иллюстраций тоже на разных уровнях? Наверное, все уже поняли, что в англоязычном оригинале на одном уровне.
 
Прошу заметить, что я вообще-то претензии к обработке в данных проилююстрированных случаях не высказываю, мне просто интересно качество печати издательства Мир в 1983 году.
 
И ещё, попрошу не обвинять TelecomUral, дескать, зачем он их сюда привёл. Не надо считать других книголюбов такими тупыми, что они не умеют пользоваться поиском, или не знают наперечёт все программы сканобработки, которых на пальцах одной руки.

Всего записей: 832 | Зарегистр. 04-11-2019 | Отправлено: 11:27 26-07-2024 | Исправлено: jourmager, 11:53 26-07-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
опасение, что кто-то сделает лучше?


Цитата:
Неужели в 1983 году было так плохо с офсетной печатью в СССР

дальше можно не читать.
сделайте лучше, я буду только рад взять в свою библиотеку. А так разговор ни о чем.
 
и откуда такое отношение как будто я с кем то соревнуюсь. Школьники что ли.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 11:54 26-07-2024 | Исправлено: bolega, 11:56 26-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
последние семь постов от bolega тут http://publ.lib.ru/cgi/forum/YaBB.pl?action=recent  

Посмотрел книгу с адреса: https://workupload.com/file/JxXCbMK62kq , сделанную bolega. Впечатляет, высший пилотаж, прекрасный образец того, как надо делать книги, и это пример чистого вектора в PDF без всяких изощрений со сглаживанием шрифта текста. Получил огромное удовольствие. Благодарю.
 
Посмотрел все книги с указанного выше адреса:
 
Kvant 2020 nomer 03.pdf, 68 стр., 3.4 Мб – как оказалось сделал не bolega, но книга – высший пилотаж, совершенный пример векторного PDF.
 
Rydnik(1981).pdf, 189 стр., 6.28 Мб – не знаю теперь, кто же её сделал. В целом сделана мастерский, пример типичного растрового PDF, размер адекватный, но, автор не справился с задачей устранения пятнистости офсетной печати на стр. 30 - Дифракционные явления в изображениях светящихся точек. Bolega  считает, что в таких случаях должен помогать descreen, применял ли автор его? Аналогично и на стр. 51. При этом на стр. 89 – рис. 11 – следов офсетной печати нет, как так? Аналогично на стр. 107 – рис. 15. Но в целом работа сделана превосходно, тем более, что в содержании использованы гиперссылки.
 
Rydnik(1981).djvu, 189 стр., 3.24 Мб – не знаю теперь, кто же её сделал, остальное всё то же самое. Работа сделана превосходно.
 
Эти, вышеуказанные книги, по моему мнению, прекрасный образец для подражания всем остальным. Вот так надо научиться делать книги! Надеюсь, что сделаны эти книги в SK, а не в ST!
 
Bredbery(1983).djvu, 134 стр., 44.7 Мб – кто автор, теперь я уже понять не могу. Замечательно сделанный DjVu, но страницы открываются очень тяжело, очень много картинок, я даже и не ожидал, что такое возможно для DjVu, на многих страницах с картинками, особенно на стр. #16, автор  не смог убрать просвечивающийся текст оборотной стороны. Учитывая всё это, а главное, явно завышенный размер файла, уверен, что конвертация сделана в SK.
 
Dozje(1980).djvu, 134 стр., 38 Мб – не просвечивает текст обратной стороны на картинках, и страницы открываются гораздо легче.
 
Slony(1983).djvu, 134 стр., 38,1 Мб – всё то же, что и в Dozje(1980).djvu.
 
Rusinov(1973).djvu, 299 стр., 21 Мб – превосходная работа, полностью отсутствуют картинки, и для такой ситуации размер неоправданно завышен, что говорит о том, что книга сконвертирована Визардом SK!
 
Rusinov(1984).djvu, 427 стр., 28.7 Мб – аналогично предыдущей книги с той лишь разницей, что размер ее соотносим с количеством страниц для DjVu. Почему такая разница в размерах у двух этих книг при совершенно одинаковой структуре книги, вот вопрос на который бы хотелось получить ответ. Но, кто даст его?
 
А в целом, вот такие примеры, когда их просматриваешь, начинаешь понимать, что такое истинное мастерство в оцифровке книг.
 
Главное: во всех этих книгах правильный размер полей! Это должно быть образцом, приятно и легко читать.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 12:00 26-07-2024 | Исправлено: zbolv, 15:29 26-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
сделайте лучше, я буду только рад взять в свою библиотеку. А так разговор ни о чем.
 
и откуда такое отношение как будто я с кем то соревнуюсь. Школьники что ли.

Если так, дайте ссылку на сканы.

Всего записей: 482 | Зарегистр. 22-06-2016 | Отправлено: 12:01 26-07-2024 | Исправлено: esys, 12:02 26-07-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кстати, книга довольно показательная в части размеров страниц. Мне интересно, кто как с этим борется. В книге понятно все страницы одного размера, а сканы - разного. Наверно, из-за того, что одни страницы лучше раскрываются, другие - хуже, одни целиком видны, другие частично уходят вглубь переплета. Когда нет иллюстраций, это роли не играет никакой, но когда они по краям, это и приводит к тому, на одних страницах картинки на всю ширину видны, а на других - не достают. Я вижу два решения: обрезать самые широкие/высокие иллюстрации и растягивать их. Ни один, ни другой я не приемлю. Может есть какой третий вариант?  
 
Добавлено:
И еще, сравнивать с английским оригиналом вообще некорректно. У них и бумага другая, и даже иллюстрации не на тех страницах расположены, чем в русском переводе. Про цветопередачу я вообще молчу. Кажется, эта серия на английском вся есть в архив.орг, но там как обычно все обрезано по бокам.
 
Добавлено:

Цитата:
попрошу не обвинять TelecomUral,  

надеюсь, он тоже улыбнулся как и я. Если кто не знает, мы с ним в паре сотрудничаем с 2009г.  
 
Добавлено:
И еще, книги на 1200dpi получаются очень большими. На одном форуме недавно математики изучали эту проблему, вердикт был такой - на сегодняшний день ни у кого из производителей софта для djvu/pdf нет реализации алгоритма jb2/jbig2, который бы хорошо сжимал 1200dpi, существующие программы ориентированы на 300/600 и прямое их применение к 1200 дает неудовлетворительный результат. Есть небольшая надежда, что допилят алгоритм, иначе тупик.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 12:07 26-07-2024 | Исправлено: bolega, 12:35 26-07-2024
Archivist

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Мне интересно, кто как с этим борется. В книге понятно все страницы одного размера, а сканы - разного. Наверно, из-за того, что одни страницы лучше раскрываются, другие - хуже, одни целиком видны, другие частично уходят вглубь переплета. Когда нет иллюстраций, это роли не играет никакой, но когда они по краям, это и приводит к тому, на одних страницах картинки на всю ширину видны, а на других - не достают. Я вижу два решения: обрезать самые широкие/высокие иллюстрации и растягивать их. Ни один, ни другой я не приемлю. Может есть какой третий вариант?

Третий вариант - восстанавливать утерянную часть картинки в графическом редакторе. Для массового применения не подходит. Растягивать нельзя категорически. Такие книги с большим количеством иллюстраций в край страниц лучше разбирать перед сканированием. Деструктивно, зато качественно.

Всего записей: 354 | Зарегистр. 10-08-2018 | Отправлено: 12:41 26-07-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zbolv

Цитата:
Посмотрел книгу с адреcа: https://workupload.com/file/JxXCbMK62kq , сделанную bolega.

Это не я делал. Нашелся один добрый человек, который собрал по сусекам все векторные pdf кванта, починил везде шрифты и кривые кодировки, распознал.

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 12:42 26-07-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zbolv

Цитата:
автор  не смог убрать просвечивающийся текст оборотной стороны

угу, не придал этому значения. Проблема еще и в том, что в общем случае делать это я не умею...
 

Всего записей: 4570 | Зарегистр. 09-09-2002 | Отправлено: 15:41 26-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Проблема еще и в том, что в общем случае делать это я не умею...  

У меня тоже это не получается, изгаляюсь, как могу в таких случаях, но, возможно, как-то это можно сделать... Кто знает, отзовитесь?

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 17:21 26-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
надеюсь, он тоже улыбнулся как и я.

конечно.
 

Цитата:
bolega
дальше можно не читать.

а вот тут я реально посмеялся над цитатой об офсете. Вроде jourmager постарше меня, а такое пишет.
 

Цитата:
esys
дайте ссылку на сканы

https://drive.google.com/file/d/19FhJFeif99a5RRdPNcFly2MivERooapz/view?usp=sharing
https://drive.google.com/file/d/1rloKOMc9CvsSnDHWTJQJv2lm7TtWacbE/view?usp=sharing
полежат очень недолго, думаю, сутки.
 

Цитата:
Archivist
Такие книги с большим количеством иллюстраций в край страниц лучше разбирать перед сканированием. Деструктивно, зато качественно.

личные я бы и разбирал. А библиотечные увы.
И иногда (нередко!) сгибы таковы, что и разбор на листы не спасает - или подрезано или загиб мимо осевой линии. Должна быть картинка вся тут, а с нее почти сантиметр под корешковый загиб уехал на другую страницу. Там, соответственно, другая картинка срезана с противоположного края.

Всего записей: 3340 | Зарегистр. 15-07-2010 | Отправлено: 17:29 26-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Image enhance filters
 
Сейчас я поэкспериментировал с окошком Image enhance filters на страничке, где не выделены зоны. В этом окошке менял настройки, нажимал кнопочку применить к имеджу, но когда нажимал процесс, в VR появлялось изображение скана, которое бывает всегда без каких-либо изменений настроек в Image enhance filters. Поэтому вопрос: с какими изображениями работает Image enhance filters, может быть с зонами? Благодарю, и  ожидаю ответ.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 18:09 26-07-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru