Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63

Открыть новую тему     Написать ответ в эту тему

Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть | 4 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v7.00 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


О Хрестоматии 2.1 SK
ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 39133 | Зарегистр. 26-02-2002 | Отправлено: 21:56 14-09-2023 | Исправлено: TelecomUral, 17:04 07-10-2024
anatol1950

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Одного придурка уже удалили с форума.
Ещё один придурок остался - zbolv
Кто его удалит?
 
Добавлено:
Одного придурка уже удалили с форума.
Ещё один придурок остался - zbolv
Кто его удалит?

Всего записей: 46 | Зарегистр. 22-04-2017 | Отправлено: 22:10 23-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys
 
Благодарю за вариант обработки файла 061, было бы неплохо, если бы Вы сделали его доступным для других чуваков, на таких примерах и стоит учиться. На мой взгляд Вы сделали всё очень хорошо, особенно понравился текст. Жаль, что этот прекрасный образец сделан не в SK.
С разрешения автора ссылка на этот чудесный вариант: https://cloud.mail.ru/public/3zDg/FvEwZtrak
 
Добавлено:
anatol1950

Цитата:
Одного придурка уже удалили с форума.  
Ещё один придурок остался - zbolv  
Кто его удалит?  

Знаешь, ты оказался еще тупее и хамовитее (т.е. ты из рода Хама), нежели известный здесь на форуме, потерявший авторитет чувак, но всё ещё полагающий, что он действительно – значимость в этом мире! Теперь о твоей тупости и хамстве знают все чуваки форума!!! Прекрасно, когда идиотизм сам себя обличает, так сказать, из внутренних побуждений! Прекрасно, чувак!

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 09:36 24-07-2024 | Исправлено: zbolv, 13:15 25-07-2024
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вариант обработки файла 061

Данный вариант (который как бы оффтоп - см. "этот прекрасный образец сделан не в SK") не впечатлил.
1) маленькие поля - мелочь, но неприятная
2) снижение dpi до 150 привело к видимому ухудшению качества иллюстраций. Конечно, можно поспорить о художественной ценности и иллюстративной информативности, но.
3) в качестве образца выбрана страница элементарная с точки зрения обработки - ч/б текст и прямоугольные полноцветные изображения, почти нет перекоса.
 
Пусть меня поправят более сведущие специалисты, но ИМХО намного труднее сделать:
1) цветной текст, особенно если символы нечёткие - см. заголовки в данном исходнике
2) таблицы - чтобы были чёткие и ровные границы с равномерной цветной заливкой - см. форзац и нахзац исходника
3) непрямоугольные изображения с неровными границами - чтобы была равномерная заливка белым фоном
4) малоцветные изображения вообще - чтобы была равномерная заливка в областях с неровными границами
5) обработать плавные полутоновые переходы на больших почти однородных поверхностях типа неба, стены, дороги
6) убрать просвечивающий с другой стороны текст и картинки

Всего записей: 837 | Зарегистр. 04-11-2019 | Отправлено: 10:45 24-07-2024 | Исправлено: jourmager, 10:53 24-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
Данный вариант (который как бы оффтоп - см. "этот прекрасный образец сделан не в SK") не впечатлил.  

Мне понравилось то, что хорошо сделан текст. На картинку я не обращал внимание, потому что понятно, что автор не занимался ею, возможно ST не имеет тех богатых возможностей для этого, как SK. Относительно полей: пример того,что всё таки поля небольшие, но должны быть, но не те, что в бумажном варианте. А в целом меня работа esys впечатлила, особенно тем, что размер файла всего 82 Кб. Но Вы во многом правы. Во всяком случае, я получил удовольствие от анализа его работы и многое для себя почерпнул полезного. Благодарю. Исследовать работы других чуваков форума очень приятно и полезно.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 10:58 24-07-2024 | Исправлено: zbolv, 13:24 25-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Относительно полей

рекомендации редактору, что я читал, были такие: для читаемости прямоугольного блока текста не менее 6 и не свыше 12 высот строчной буквы. Для удобства работы с бумажной книгой: под захват большим пальцем руки (1й фалангой, она самая крупная) не должны попадать буквы, чтобы от касания не стирался шрифт. Многие небось жирные фингерпринты на полях видели Также поля должны быть достаточны для записи мелкого карандашного текста в пределах одного-двух простых предложений у каждого развернутого абзаца (свыше 7-8 строк текста), если предполагаются рукописные пометки читателя - комментарии к научному тексту, например. Или к учебному.

Всего записей: 3341 | Зарегистр. 15-07-2010 | Отправлено: 11:19 24-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Пусть меня поправят более сведущие специалисты, но ИМХО намного труднее сделать:  
1) цветной текст, особенно если символы нечёткие - см. заголовки в данном исходнике  
2) таблицы - чтобы были чёткие и ровные границы с равномерной цветной заливкой - см. форзац и нахзац исходника  
3) непрямоугольные изображения с неровными границами - чтобы была равномерная заливка белым фоном  
4) малоцветные изображения вообще - чтобы была равномерная заливка в областях с неровными границами  
5) обработать плавные полутоновые переходы на больших почти однородных поверхностях типа неба, стены, дороги  
6) убрать просвечивающий с другой стороны текст и картинки

Все правильно Вы сказали, и вот этому бы надо обучать друг друга, как всё это делать грамотно, но в SK.
 
Добавлено:
TelecomUral

Цитата:
рекомендации редактору, что я читал, были такие...

Всё верно, для бумаги так и должно быть. Но цифровые книги? Даже в Word всё это предусмотрено, но безо всяких полей.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 11:21 24-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Но цифровые книги?

вот вы пишете цифровой комментарий в цифровой пдф-книге. вы его прямо на текст налепите, сверху?

Всего записей: 3341 | Зарегистр. 15-07-2010 | Отправлено: 11:28 24-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys  
 
Из присланных дополнительно картинок я понял, что Вы сделали всё это в ST. Да, фото программы впечатляет, видимо это последняя версия ST, ранее он не выглядел так внушительно и организованно. Но я прикипел душой к SK. В принципе, было бы интересно взять несколько страниц какой-нибудь сложной книги и сделать их в SK и ST и сравнить результаты.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 11:46 24-07-2024 | Исправлено: zbolv, 13:26 25-07-2024
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
снижение dpi до 150 привело к видимому ухудшению качества иллюстраций

Видеть типографские пиксели оригинала с кратным ростом веса тоже ни к чему. Хотя есть любители созерцать бумагу на ЖК экране.

Всего записей: 490 | Зарегистр. 22-06-2016 | Отправлено: 12:16 24-07-2024 | Исправлено: esys, 12:18 24-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys

Цитата:
есть любители созерцать бумагу на ЖК экране.

Вы оригинально решили проблему, но ради эстетов и стремятся к качеству даже в DjVu...

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 13:48 24-07-2024
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Зачем вы их сюда привели "оттуда"?  
Вместо того, чтобы учить людей делать книги качественно, они занимаются только одним: гнобить СК везде и всегда. Что, в общем-то, не ново и имеет место быть давно. Им полегчает только тогда, когда все уйдут от СК к аналогу. Я не против, но где хорошие книги, Карл? Столько делателей в аналоге, а нормальных книг несоразмерно меньше. Суффиксов аналогов с пяток, пользователей наверно тысячи, а нормально сделанных книг кот наплакал. Цель ведь не в программе, а в том, как и сколько книг с помощью нее делаются, разве не так.
И да, они (т.е. патологические ск-ненавистники) сюда пришли, чтобы воплотить старый анекдот про рабочих и японскую пилу.

Всего записей: 4571 | Зарегистр. 09-09-2002 | Отправлено: 19:18 24-07-2024
anatol1950

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
И я говорю: это безграмотное быдло zbolv надо гнать отсюда. И как можно скорее!

Всего записей: 46 | Зарегистр. 22-04-2017 | Отправлено: 20:57 24-07-2024
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
bolega
Цель ведь не в программе, а в том, как и сколько книг с помощью нее делаются, разве не так.

Так.  

Цитата:
Зачем вы их сюда привели "оттуда"?

Ну, цель я такую не ставил, скорее наоборот. "Оно само".
 
Понимаете, чтобы что-то менялось в нужную сторону, надо прикладывать личные усилия по правильному вектору. Отсюда следует, что надо именно среди тех тысяч зудеть "а ведь можно и иначе книги делать". Кто добрался до кромсатора, тот уже хоть что-то понимает в книгообработке. Вытекающие следствия - единицы из тысяч будут приходить сюда со своими правилами и поначалу их доказывать. Эти единицы требуется переучивать, а как вы хотели. Опять усилие. "Само" будет только через "одной кнопочкой в djvuSolo".
 
И ещё.
Хорошо сделанные книги нигде не сконцентрированы и тупо не замечаются. Я прикидывал, ведь сделанных на отлично е-книг не так уж и мало, думаю, с пару тысяч легко наберется (даже без радиотехники от Похорского). Может даже с десяток тыс будет. Но в 4х миллионах либгена и 2х миллионах твирпкса они растворены до исчезновения. А кто хорошего не видел, тот никуда и не стремится.

Всего записей: 3341 | Зарегистр. 15-07-2010 | Отправлено: 21:32 24-07-2024
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я прикидывал, ведь сделанных на отлично е-книг не так уж и мало, думаю, с пару тысяч

Так нагадить на голову "Колхозу"! Это надо постараться.

Всего записей: 3399 | Зарегистр. 22-03-2005 | Отправлено: 21:53 24-07-2024
Benoni



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
"Оно само"!

Всего записей: 1859 | Зарегистр. 15-06-2006 | Отправлено: 10:54 25-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И я говорю: это безграмотное быдло zbolv надо гнать отсюда. И как можно скорее!  

А ты, хам, сколько книг сделал с помощью SK? Я лично только этой программой и пользуюсь, а ST полностью отвергаю.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 13:19 25-07-2024 | Исправлено: zbolv, 13:21 25-07-2024
shrmn



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Версия 7.0  
Исправил баги.  
https://workupload.com/file/Kk7Wcw5DEfD
ссылка не действительна. поделитесь, пожалуйста, последней версией программы.  

Почему бы не внести ссылку в шапку?

Всего записей: 4093 | Зарегистр. 17-12-2002 | Отправлено: 13:45 25-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
TelecomUral  
Зачем вы их сюда привели "оттуда"?  
Вместо того, чтобы учить людей делать книги качественно, они занимаются только одним: гнобить СК везде и всегда. Что, в общем-то, не ново и имеет место быть давно. Им полегчает только тогда, когда все уйдут от СК к аналогу. Я не против, но где хорошие книги, Карл? Столько делателей в аналоге, а нормальных книг несоразмерно меньше. Суффиксов аналогов с пяток, пользователей наверно тысячи, а нормально сделанных книг кот наплакал. Цель ведь не в программе, а в том, как и сколько книг с помощью нее делаются, разве не так.  

Уважаемый автор! Для меня странно то, что Вы, такой авторитетный и мощный программист, создавший программу уровня Word по сложности (это мнение моего сына, а он разбирается в IT и превосходно знает Linux, на нём только и работает, а Windows отрицает), так сокрушаетесь тогда, когда кто-то пытается доказать преимущество несравнимого с Вашей программой – примитивного для кухарок ST?
Когда я сыну показываю свои работы, сделанные в SK, он восхищается и считает, что аналога Вашей программе пока не существует. В результате последней дискуссии, показав сыну образец esys ( https://cloud.mail.ru/public/3zDg/FvEwZtrak ) и мой ( https://workupload.com/file/n5E5uCRDKNT ), он прямо признал, что никакого сравнения с моими работами нет, что ST – программа примитивная. Ему также понравился только текст в этом образце. Сыну также хочется обрабатывать тексты (пока это он предпочитает предоставлять мне), и он хочет на Linux иметь подобную программу. Его выбор таков: буду работать на ST!
Из-за её преимуществ: кроссплатформенность, ST существует и для Linux, крайне простые настройки и способы достижения целей. Он прямо сказал, что изящество книг, которое, как он считает, удается мне достигнуть на SK, ему не нужны! Его вполне устраивает уровень ST! Однако, у себя на системах, он предпочитает оставлять книги, сделанное мною в SK, и предлагает всегда, понравившуюся ему книгу, особенно скачанную с Интернета (а там, в основном, ужасного качества книги), переделать ее в SK, чтобы потом ее читать самому и хранить у себя! Вот Вам мнение человека, который видел оба варианта работы двух программ и желает самостоятельно, иногда, обрабатывать тексты!  
Вы же, уважаемый, хотите заставить всех людей жить так, как считаете возможным для себя. Вы прекрасно понимаете, что это невозможно! И прошедшая дискуссия, на мой взгляд, и показала преимущество SK над ST, тем более по мнению стороннего человека в этом вопросе в моей семье. А Интернет – это бескрайний океан, где есть всё: от обильно плавающего на поверхности говна, до жемчужин, лежащих на дне, и чаще всего, в скорлупе! И пользуется тем или иным тот, кто к чему приучен воспитанием. Так чем Вы недовольны, что пишете подобные комментарии, приводящие любителей Вашей превосходной программы в изумление? Всё в мире происходит так, как происходит. и от нас очень многое не зависит.

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 13:58 25-07-2024 | Исправлено: zbolv, 17:19 25-07-2024
sovokr

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подробнее...

Всего записей: 2 | Зарегистр. 25-07-2024 | Отправлено: 15:58 25-07-2024 | Исправлено: sovokr, 16:00 25-07-2024
zbolv

Запрет на пост
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sovokr

Цитата:
Некоторые книги важно увековечить в цифре - здесь СК незаменим.  

Золотая мысль!
 
Добавлено:

Цитата:
В электронных читалках и при распечатке такой документ выглядит заметно лучше растрового.  
Из минусов: в несколько раз раздувается размер файла.  

Чтобы получить векторный вариант ч/б изображения текста с растровыми картинками, достаточно изготовлять PDF в FR и затем распознавать и тщательной вычитывать (есть там функция проверки). После чего при создании собственно PDF выбираешь один из 4-х вариантов. Для Вас будет необходим вариант «только картинки и текст». И Вы получите чистый векторный документ с растровыми картинками, да еще и размер файла уменьшается в несколько раз в сравнении с иными тремя вариантами. Поэтому загружать SK тем, что давно существует в FR, нет никакого смысла, иначе точно все сбегут на примитивный ST, а, главное, всё это уже в SK есть, и кто желает, пользуется этой функцией!
 
Добавлено:
Просмотрел Ваш пример, так вот, то, что Вы считаете векторным документом, совершенно не есть таковой. Это обычный растровый документ с использованием функции сглаживания изображений шрифтов, потому и размер файла увеличивается значительно. Эта же функция есть и в FR. Так что Америку Вы, увы, не открыли! И главное, все конвертеры PDF работают прежде всего с изображениями, и создают векторный документ, если есть текстовая подложка, как, например, при конвертации текстовых документов. В иных случаях документ надо распознавать, т.е. создавать этот текстовый слой специально (OCR). В принципе, эта функция уже существует в SK, и используя её, можно получить отличный векторный PDF c растровыми картинками. Потому Ваши "векторные" PDF и увеличиваются в размере более чем в пять раз в сравнении с обычным растровым PDF, и более 50 раз, в сравнении с истинным векторным текстом PDF.  
Для примера я взял Ваш файл p0393.tif, весит он 106 Кб. Сначала прогнал его через Doro, создав стандартный PDF, вес его - 106 Кб. Когда Вы прогоняли этот файл через Ваши «векторные» программы создания PDF, то его вес стал – 518 Кб. После прогонки его через FR, проведя распознавание (OCR), я получил чистый векторный PDF и он весит – 11,4 Кб. Все эти исследования я запаковал для Вас в архиве, качайте с адреса: https://workupload.com/file/py7TL4DnMQU

Всего записей: 100 | Зарегистр. 26-03-2024 | Отправлено: 16:58 25-07-2024 | Исправлено: zbolv, 18:32 25-07-2024
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru