Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор

Модерирует : gyra, Maz

Widok (17-08-2007 15:16): лимит страниц. продолжаем здесь  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101

   

ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Старые версии:
 
5.52beta (1,81 МБ) + dll-ки, необходимые для работы программы (405 КБ)
 
Full-версии - вкл. dll-библиотеки и Help к SK v1.0 в формате Pdf:
 
v3.5 (1,52 МБ)  v5.07 (1,98 МБ)  v5.51b (2,06 МБ)  v5.52b (2,05 МБ)  
 
Текущая версия:
 
ScanKromsator v5.6А Full (вкл. dll-библиотеки и Help к SK v1.0 в формате Pdf). (2,25 МБ) What's new  Зеркало
 
Хелп v1.0 для Кромсатора:
 
1. В формате PDF:
http://rapidshare.de/files/1815394/ScanKromsator.pdf.html (размещен временно):
 
2. В форматах HTM и DOC:
http://www.djvu-soft.narod.ru/sk_doc_htm_help_v1_0.rar  (537 КБ)
 
Вопросы и ответы по работе со СканКромсатором последних версий:
http://abab.front.ru/QandA_SK.zip (80 КБ, от 20.06.06)
 
Пособие по Кромсатору: http://www.djvu-soft.narod.ru/kromsator/
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности.
 
ScanAndShare - инструкция в картинках, в том числе и начальные установки SK
1.03 или 1.06

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 12:53 17-05-2005 | Исправлено: vitaly1, 16:02 10-01-2007
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто-нибудь имеет инфу о том, чем 3600 отличается 3600+
На сайте ничего не понять.

Всего записей: 4571 | Зарегистр. 09-09-2002 | Отправлено: 13:43 21-04-2006
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Кто-нибудь имеет инфу о том, чем 3600 отличается 3600+  
На сайте ничего не понять.

 
Я нвмного размышлял над этим- мне кажется там где +  немного больше софта дают. Который кстати у нас всех уже давно есть или должен быть

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 13:50 21-04-2006
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Возможно, интерфейс и неинтуитивен.
Но представьте на минуту, если я попрошу вас по вечерам каждый день заниматься вышиванием крестиком. Для меня программирование интерфейса - такое же скучное и ничего не дающее ни уму ни сердцу занятие. Там, где дело касается алгоритмов, где надо подумать и покопаться в литературе и журналах, там мне интересно, да думаю и любому другому, делающему бесплатные программы.
В сети можно найти много готовых исходников всяких отдельно взятых полезных алгоритмов, связанных с обработкой изображений. Но никто за просто так не хочет связываться с созданием полнофункциональной программы, объединяющей все это в единое целое, да и еще под управлением нормального графич. интерфейса, а не командной строки. Потому что, повторюсь, дело это - трудное, муторное, неинтересное, и главное, неблагодарное.
(Только не приводите мне как контраргумент всякие ImageMagic,Gimp и прочие. Эти программы - просто набор классических фильтров, описанных в любой книжке по ImPr. Ничего полезного для нашего дела там нет и быть не может, такого, чего бы уже не было в любом другом обычном графическом редакторе).

Всего записей: 4571 | Зарегистр. 09-09-2002 | Отправлено: 14:00 21-04-2006
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Why OpticBook 3600 Plus?
Does not require extra PDF software  
Scan to PDF through a simple process  
Generate all the scanned files to PDF, merge to a single file or separate sheet.
Costs less than Adobe® Acrobat®
Scan to email, copy and custom option.  
Administrative control over PDF file path
Customized options available on the interface  
176 languages OCR support  
High quality image scan result

Всего записей: 3400 | Зарегистр. 22-03-2005 | Отправлено: 14:20 21-04-2006
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
я в Германии заказал за 210 Евро  
но уже жду 2 недели а его нет...  

 
я тоже мог заказать с ибея за 249 долл.
 
однако доставка, таможня, проч. вышли бы в те же деньги.
 
а тут местная фирма и гарантию от себя дала...

Всего записей: 669 | Зарегистр. 14-11-2003 | Отправлено: 14:37 21-04-2006
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Мне вообще-то очень понятно то что пишете.
(я пишу на с++ и фортране, в основном квантовая динамика) Интерфейса у нас никакого- дело идет в линуксе. файл.in и файл.out (Но никто бы и сдесь не отказался от него)
Ну а если я вам скажу что вы вот сделали 98! шагов к цели и остались эти последние два шага? Посмотреть на него глазами домохозяйки и причесать этот интерфейс наконец?
Вы правильно заметили- конкуренции у вашей программы -никакой.
Потому что вы все равно впереди всех сейчас.  
 
Но если вы взялись за это дело, то  наверное вы не хотели бы, чтобы программа проработав несколько лет- зачахла, и вымерла как динозавр. Во всяком случае не думаю, что вы об этом думали, садясь писать программу.
 
Думаю, что число пользователей, при упрощении интерфейса могло бы увеличится на 500-1000%
(Да и не очень сложно это- добавить визард( продублировать панель с опциями но добавить всплывающие подсказки),  Ну и добавить прямо в меню выбор темплейтов- Черно белый скан, серый скан, серый с картинками, и тд...?)
Устали?
Организуйте проэкт на sourceforge или им подобным.
Думаю и несколько десятков  $ от благодарных пользователей вам не повредят. К тому же это будет неплохим стимулом, не правда ли?  
 
Можно обьявить конкурс- на лучший по функциональности! фейс кромсатора.
 
Думаю желающие будут
 
К тому же это поможет вам взглянуть на свою программу глазами простого пользователя, цель которого- превратить кучу тифов в Книгу!
 
 
 

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 14:38 21-04-2006
romanef



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я нвмного размышлял над этим- мне кажется там где +  немного больше софта дают

 
  ага, плюстек анонсировал сканер для слепых
 
  http://www.mybookreader.com
 
 
    вроде тот же Оптикбук и text-to-speech software    
 
  (700 долл)

Всего записей: 669 | Зарегистр. 14-11-2003 | Отправлено: 14:40 21-04-2006 | Исправлено: romanef, 14:43 21-04-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
terminat0r

Цитата:
 Ну и добавить прямо в меню выбор темплейтов- Черно белый скан, серый скан, серый с картинками, и тд...?)

Вот и я все ратую за теплейты.
Ведь коммьюнити вполне может взять на себя создание оных.
bolega может сделать минимум - ввести возможность создания темплейтов. Ведь сохранение настроек - вообще, штука важная, а сейчас этой возможности практически нет.
Что можно включить в темплейт:
1) опции/значение параметров;
2) порядок выполнения тех или иных алгоритмов;
3) возможность создания комментария к темплейту (в идеале - формат *.html с картинками);
4) возможность сочетания темплейтов друг с другом (напр., темплейт для текста с неровным фоном + темплейт для плохо пропечатанных литер).
Мне думается, это несложно сделать.

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 14:58 21-04-2006 | Исправлено: ghosty, 15:18 21-04-2006
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT

Цитата:
Costs less than Adobe® Acrobat®  

Первый раз вижу, чтобы сравнивали железо и прогу
Т.е. надо понимать, что в 3600+ новшества чисто программные.
 
Кстати, есть ли в нем возможность как-то отключить сглаживание. Он ведь во всех режимах его втихаря выполняет. И я заметил, что если где-то текст плохо пропечатан, то после его сглаживания (аппаратного или программного - не знаю) он становится еще хуже (в Epson та же страница получается намного разборчивее) . В настройках вроде бы нет, или плохо искал. Аналогично, хуже (по сравнению с Epson) сканируется текст серого или голубого цвета в режиме b/w.
И еще одно наблюдение, но уже не в пользу Epson. У него, как известно есть два режиа - сканирование документов и сканирование фото. В первом случае он очень хорошо чистит слабый фон, например, просвечивающаяся обратная сторона страницы полностью отфильтровывается. Но при этом наблюдаются заметные искажения цветных иллюстраций (я испытывал на репродукциях, где паразитный фон нужно было удалять однозначно). А вот Opticbook сосканировал прекрасно и без всяких искажений цветопередачи.
 
 
 
Добавлено:
terminat0r
Я не отказываюсь от улучшения, но сейчас на это нет время. Ведь операцию не назовешь косметической, скорее - косметологической.  
К тому же резаки - это в своем роде паспорт, особая примета, кромсатора.  
Но почему-то все предлагают мне сделать кромсатор похожим хоть на какую-то, но совершенно другую программу.

Всего записей: 4571 | Зарегистр. 09-09-2002 | Отправлено: 15:22 21-04-2006
ALLBETONRU

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Хорошо, что Вы об этом сказали.  
Меня уже давно мучает вопрос, почему при таком повальном увлечении сканированием всего и вся, и немалом спросе на инструменты обработки, до сих пор не появляется ничего альтернативного кромсатору (под windows), во всяком случае в той же ценовой категории?  
Для меня это просто загадка. Обычно рынок всегда живо реагирует на спрос. А тут непонятно. Или все так зачарованы FR, что и пытаться боятся. Или боятся наших "законодателей", которые завтра примут "закон" о том, что инструменты обработки копирайтных материалов будут приравниваться к самому копированию таких материалов?  
Взять например вьюеры - их полным полно, какие хочешь, и платные, и бесплатные. И OCR-программ предостаточно. А по специализированной обработке книг - ничего. Один BR, да и тот изначально делался как дорогое дополнение к ихним собственным таким же дорогим сканерам.

 
 
Уже давно слежу за развитием проекта «Скан Кромсатор». Огромное спасибо как разработчику программы так и всем его добровольным помощникам. Но позвольте высказать свои соображения по данному вопросу, тем более что лично оцифровал не одну сотню книг и часто пользовался при этом Скан Кромсатором.
 
И соображения эти несколько отличны от узкого обсуждения программных особенностей.
 
Во первых давайте честно, - Скан Кромсатор настолько тяжел в освоении, что просто отпугивает новичков. И чем дальше, тем более «тяжеловесной» становится программа, она донельзя уже и так перегружена всяческими прибамбасами, с которыми уже и профессионалу разобраться сложно. Про путанный и неинтуитивнопонятный интерфейс, отсутствие толкового Хелпа или непонятная ориентация на англоговорящих – я вообще молчу.
 
И развитие Скан кромсатора идет в сторону все большего усложнения – а иначе и быть не может, ведь Скан Кромсатор пытается (с перманентным успехом) оперировать исключительно с графическими образами информационного контента. Отсюда и все беды.
 
Мне кажется что такой подход – тупиковый т.к. он изначально предполагает облагораживание информационного контента исключительно в форме улучшения его графического образа без предварительной интеллектуальной оценки самой информации – а ведь если тупая машинерия начнет хоть чучь-чуть понимать написанное – гораздо легче станет модифицировать и улучшить  графический образ.  
 
Например если программа «понимает» (или вычисляет) что в определенном районе на странице может находиться фрагмент графического образа который един для всех страниц (нумерация страниц, например) то значительно облегчается обрезка полей.
 
Это я к чему клоню? – К ответу на вопрос «– А почему нет аналогов Скан Кромсатору». А их нет по той простой причине, что (это мое личное мнение) – данное направление тупиковое. А соответственно и не имеет коммерческого интереса.
 
У FR была замечательнейшая опция, которую по непонятным причинам убрали в 8 версии – «что не смог распознать – в картинку». Мне кажется что именно за этим путем, с задействованием интеллектуальных механизмов распознавания, - будущее. И сделать то нужно совсем ерунду – добавить в FR управление по степени достоверности распознавания. Вернее даже не добавить а вывести её как опцию для пользователя.
Почему разработчики FR этого до сих пор не сделали, мало того зачем они убрали «выводить как картинку» из FR8 – вот главный вопрос. Возможно (я так предполагаю) нет принципиальной заинтересованности в массовом появлении в Интернете действительно качественных djvu книг. Возможно (это тоже всего лишь мое предположение) – идет торг с Лизардом и как только он закончится мы прям из FR будем получать отменного качества djvu книги.
 
А пока затыкая информационные дырки я размещаю в сети откровенно некачественные djvu книги, хотя все сырые сканы сохраняю – в ожидании не новой версии Скан Кромсатора, но нового FR.
 
 
C уважением Сергей Ружинский

Всего записей: 3 | Зарегистр. 03-04-2006 | Отправлено: 11:38 22-04-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALLBETONRU

Цитата:
А пока затыкая информационные дырки я размещаю в сети откровенно некачественные djvu книги, хотя все сырые сканы сохраняю – в ожидании не новой версии Скан Кромсатора, но нового FR.

Ничего не понял. Вы Кромсатор обвиняете, что книги откровенно некачественные получаются?

Цитата:
идет торг с Лизардом и как только он закончится мы прям из FR будем получать отменного качества djvu книги.

А почему Вы думаете, что именно в этом случае качество будет гарантировано?
 
Добавлено:

Цитата:
Мне кажется что такой подход – тупиковый т.к. он изначально предполагает облагораживание информационного контента исключительно в форме улучшения его графического образа без предварительной интеллектуальной оценки самой информации – а ведь если тупая машинерия начнет хоть чучь-чуть понимать написанное – гораздо легче станет модифицировать и улучшить  графический образ.  

Одно другому не мешает. Скорее наоборот: улучшение графического образа способствeует более аккуратному распознаванию.  
 
Мой ответ, почему аналогов Кромсатору нет. Дело в том, что в той же Европе над подобными проектами работают целые лаборатории.
Вот пример: DEBORA Project. У них даже формат свой собственный (типа улучшенного DJVU).  
Автору Кромсатора удалось объять необъятное. А понять, как работает Кромсатор не в пример легче

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 12:09 22-04-2006 | Исправлено: ghosty, 12:22 22-04-2006
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALLBETONRU

Цитата:
Скан Кромсатор пытается (с перманентным успехом) оперировать исключительно с графическими образами информационного контента. Отсюда и все беды

 
Согласен. Я и сам уже несколько раз писал, что в определенных местах ( и только в них) мне не хватает OCR, но на 95% он не нужен. Если вы почитаете современные (и не очень) зарубежные журналы, то там тема распознавания контента без привлечения OCR существует очень давно и с большим успехом развивается. Этим занимаются многие ученые и вряд ли они считают это тупиковым занятием
 

Цитата:
Это я к чему клоню? – К ответу на вопрос «– А почему нет аналогов Скан Кромсатору». А их нет по той простой причине, что (это мое личное мнение) – данное направление тупиковое. А соответственно и не имеет коммерческого интереса.

 
Не согласен. Во-первых, FR - это OCR-программа, функции же SK гораздо проще - убрать грязь, выровнять и привести к одному виду. И Sk с этим прекрасно справляется, проблема лишь в том, насколько он делает это автоматически, и насколько нужно юзеру вмешиваться в этот процесс.
 
Вы хотели ответить на вопрос, почему не выходит альтернатив, но так и не ответили. Скорее, Вы ответили, почему юзеры любят FR. FR - прекрасная программа, но наличие прекрасной программы не означает, что у никого не появится желания сделать альтернативу. Сравните с Photoshop.  
Тупиковость, как Вы говорите, подхода, наоборот должна служить стимулом развития альтернатив.  
 
Более того, можно лишь говорить о несовершенстве (но не о тупиковости) теперешнего состояния. А ведь есть еще идеи, которые могут кардинально исправить ситуацию. Просто я их не реализую по определенным причинам (не буду здесь о них говорить). Например, это layout-анализ с самообучением. Он уже реализован в одном проекте и дает прекрасные результаты.
И насчет возрастающей тяжеловесности интерфейса я не согласен. Например, взять введенные мною зоны. Ну не хочешь их понимать - не используй. Просто результат будет чуть хуже, чем он мог бы быть. Но другого способа выполнять какие-то операции над локальными участками не существует. А в реальных сканах такие участки всегда существуют, то ли из-за полиграфических дефектов, то ли из-за плохого сканирования.  
 

Цитата:
А пока затыкая информационные дырки я размещаю в сети откровенно некачественные djvu книги, хотя все сырые сканы сохраняю – в ожидании не новой версии Скан Кромсатора, но нового FR.  

 
Учитывая, что FR не занимается улучшением качеством графики, что в этом смысле можно ожидать от FR??? Или он как-от отрежет грязь по другому?? Более ровно? Посмотрите как коряво в нем реализован поворот изображений на малые углы. Оно и понятно - для целей OCR это абсолютно несущественно, а вот для DJVU...
Кажется, это просто оправдание Вашим некачественным книгам.
Проблема SK не в том, что результат некачественный, а в том, что в ряде случаев (точнее, для ряда страниц) еще требуется ручное вмешательство пользователя.
С уважением.
 
 
Добавлено:
Вот еще о чем хотелось бы сказать.
Многие советы по упрощению работы SK, котрые мне дают, дают люди, которые основывают свои мысли исключительно исходя из своих собственных сканов (оно и понятно). Но я провожу эксперименты на сотнях разных сканах, сделанных разными людьми, на разных сканерах. И вы не представляете как варьируется качество, от идеального, до откровенно ужасного. На некоторых сканах даже можно разобрать склонившееся лицо сканировщика , до такой степени небрежно выбирается зона сканирования, точнее, она никак не выбирается. В таких условиях говорить о каком-то едином, упрощенном, подходе к обработке не приходиться. Тут и AI не поможет.
Взять типичный случай - сканируется одна страница разворота, но в область сканирования зачем-то попадает половина (!!) другой половины разворота. Как программа обработки должна интерпретировать (на автомате) еще кучу текста на скане? Так что тут без ручного вмешательства никак не обойтись.

Всего записей: 4571 | Зарегистр. 09-09-2002 | Отправлено: 18:32 22-04-2006 | Исправлено: bolega, 18:47 22-04-2006
trigliff

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALLBETONRU

Цитата:
Почему разработчики FR этого до сих пор не сделали, мало того зачем они убрали «выводить как картинку» из FR8 – вот главный вопрос.  

Предполагаю, что здесь Вы получите ответы на эти и другие вопросы по FR.
Автор того топика
Цитата:
Красноперов Дмитрий
Проектировщик интерфейса FineReader


Всего записей: 576 | Зарегистр. 10-01-2003 | Отправлено: 21:34 22-04-2006 | Исправлено: trigliff, 21:35 22-04-2006
ALLBETONRU

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Учитывая, что FR не занимается улучшением качеством графики, что в этом смысле можно ожидать от FR??? Или он как-от отрежет грязь по другому?? Более ровно?

 
Возможно я неточно выразил свою мысль, но FR как раз и улучшает как читабельность так и простоту обработки сырых сканов.
Я описал чего не хватает, с моей точки зрения, FR-у для полного счастья, чтобы делать djvu Но т.к. я сильно отклоняюсь от заглавной темы,  если интересно то мое сообщение с приложенным файлом-образцом
 
http://allbeton.ru/viewtopic.php?t=8089

Всего записей: 3 | Зарегистр. 03-04-2006 | Отправлено: 17:09 24-04-2006
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALLBETONRU

Цитата:
В итоге получаются последние 2 стр. которые более чем хорошего качества

У нас видимо разные представления о качестве
Вас не смущает, что строчки на обеих (!) итоговых страницах повсюду разъезжаются, а на последней странице и вообще налазят друг на друга, да и шрифт там вдруг стал какой-то вытянутый. Да и чем описанные Вами там манипуляции с блоками FR лучше манипуляций с резаками в SK?
Да и вообще такой подход мне кажется тупиковым, поскольку любое распознавание предполагает вычитку, а в случае научно-технических книг это неприемлимо.
Более перспективным (хотя не факт) мне кажется подход, который недавно обсуждался в ветке по сканированию - применять FR для распознавания буквенного словаря готового djvu, там тоже понадобится вычитка, но на уровне букв словаря, а не целого текста, а это по моему мнению намного легче (что тоже не факт).

Всего записей: 4571 | Зарегистр. 09-09-2002 | Отправлено: 17:52 24-04-2006
ALLBETONRU

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
У нас видимо разные представления о качестве

 
 
Нет смысла дискутировать эту тему, т.к. понятие «качество» для djvu книг действительно не формализовано. Соответственно и каждый может наполнять это определение своим смыслом. Для меня например высшая характеристика книги – это степень её эксклюзивности. И к черту мне тогда вычищена она или нет, кривая она или косая. Главное что ни у кого нет, даже в Ленинке нет, - а у меня есть. 
Ну и второй мой критерий качественности – читабельность. Мне сложно это объяснить, но вот бывает читаешь книгу – сделана супер – а глаза слезятся, взгляд разбегается. И что самое интересное – распечатаешь, - тоже самое!
 
Мне кажется нужно каким-то образом внести ясность в данный вопрос и возможно общими усилиями сформулировать критерии степени качественности djvu книги. Или если где эта тема уже обсуждалась – дайте ссылку.
 
С моей точки зрения «крайние» точки качественной оценки можно определить достаточно однозначно.
Например «Качество – 1» - это чернобелый сырец без какой либо обработки в 300 dpi.  
«Качество 10» - это *.doc перегнанный в djvu с распознанным слоем. Между ними –  резанные, вычищенные и т.д. варианты.
 
А  пока нет четкого определения что такое качественная djvu книга сложно совершенствовать методологию и технологию их изготовления, согласитесь.
 
 
 

Цитата:
Да и чем описанные Вами там манипуляции с блоками FR лучше манипуляций с резаками в SK?

 
 
Я привел в своем примере «самый сложный случай» - и формулы, и рисунки, и таблицы и обилие мат. символов в тексте.
Для такого сложного случая возможности FR по автоматизации всего поцесса действительно еще не дотягивают – потому то и оформлено все в виде «пожелания разработчикам» а не окончательной рекомендации пользователю.  
Но та же самая операция над простым текстом (текст + рисунки) позволяет достаточно легко получить результат не в пример лучше. Хотя в любом случае право за выбором той или иной методики – за пользователем.
 

Всего записей: 3 | Зарегистр. 03-04-2006 | Отправлено: 18:59 24-04-2006
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ага, я понял, кажется, ALLBETONRU поклонник OCR-подхода
Так, он пишет (в своем FAQ):
А нельзя ли как-то обойти невозможность 100% распознавания программами OSR при создании книг в форматах pdf или djvu ?  
– Можно. И в FR до версии №8 (а сейчас вроде бы и в FR8 уже исправлено) есть такая опция для сохранения результатов в pdf – «Заменять неуверенно распознанные слова их изображениями».  
В итоге получаем отменного качества djvu книги в которых только малая толика информации сравнительно «некачественная», но читабельность от этого не теряется, и глаз порой даже не замечает подмены.

Вот это именно то, что мы приводим здесь в качестве примера отвратительно сделанной книги. Уж извините
 
И вообще, я не понимаю, зачем уже отOCRенные книги (векторизованные) конвертировать в *.djvu. Ответьте
И давайте все-таки плавно переходить в более подходящую ветку. Здесь уже в оффтоп сползаем.

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 00:07 25-04-2006 | Исправлено: ghosty, 00:08 25-04-2006
Per_aspera_ad_astra



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. У меня проблем, с полутоновыми иллюстрациями. СК может рассчитывать «средний» фон. А как именно он это делает, не подскажите.  
(когда сканирую, то использую интерфейс FR7. С функцией сканировать несколько страниц. Быстро получается. Вот отсканировал я книгу в сером 400 dpi (кстати, а в каком формате их лучше сохранять на выходе из FR – bmp, tiff (какой именно, сжатый не сжатый). Загрузил сканы (Сырцы) в кромсатор (расставил галки и др. функции). Увеличил dpi. Так как сделать так чтобы убрать серый фон, при этом не повредить полутоновые иллюстрации.
Заранее спасибо.

Всего записей: 1273 | Зарегистр. 09-07-2005 | Отправлено: 16:54 26-04-2006
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Per_aspera_ad_astra

Цитата:
Так как сделать так чтобы убрать серый фон, при этом не повредить полутоновые иллюстрации.  

Заключить их в exlude-зону (красную). На одну страницу допускается использовать до 32 зон. Такие зоны не трогаются чистильщиком фона и они не подвергаются despeckle.

Цитата:
в каком формате их лучше сохранять на выходе из FR – bmp, tiff (какой именно, сжатый не сжатый)

Оба формата - без потерь, так что подойдет любой (лишь бы не jpg). Только tiff со сжатием LZW сэкономит Вам место на диске. Кроме того, форматы со сжатием быстрее загружаются в кромсаторе.

Всего записей: 4571 | Зарегистр. 09-09-2002 | Отправлено: 18:23 26-04-2006
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
И еще одно наблюдение, но уже не в пользу Epson. У него, как известно есть два режиа - сканирование документов и сканирование фото. В первом случае он очень хорошо чистит слабый фон, например, просвечивающаяся обратная сторона страницы полностью отфильтровывается. Но при этом наблюдаются заметные искажения цветных иллюстраций (я испытывал на репродукциях, где паразитный фон нужно было удалять однозначно).

 
Так ларчик просто открывается, достаточно посмотреть на гистограмму в Epson Scan. На режиме "документ" сканер часть самых светлых и самых тёмных оттенков по каждому цвету просто отбрасывает - сознательно сужает динамический диапазон. Это видно по положению точки белого и точки чёрного.
 
В режиме фото такого сужения не происходит. Вообще, если надо добиться качественной естественной цветопередачи, нужно вручную выставлять эти точки и гамму.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 11:30 27-04-2006
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор
Widok (17-08-2007 15:16): лимит страниц. продолжаем здесь


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru