alexarbuzik
BANNED | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору SVN75 Вы заблуждаетесь! Я Вас прекрасно понял, но, к сожалению, Вы не совсем правильно понимаете процесс создания djvu. Не буду говорить за последнее, может быть компания Лизард, являющаяся автором этой удивительной технологии, в последних своих программах ввела возможность при создании djvu одновременно и создавать текстовый слой OCR, но на момент создания версии их программы Document Express Editor 6.0.1 Build 1320 такой возможности нет! Суть их технологии заключается в оригинальной возможности сжатия графических изображений максимально возможной степени с незначительными потерями качества или без такового, но выходной размер будет в разы больший. Если применять сжатие, то их технология раза в два и более обгоняет технологию AABBYY в PDF. Текстовый слой создается отдельно рамными программами, в том числе, не только FR, но и Tesseract (и здесь вопрос только в качестве распознавания). Но, в djvu, в отличие от PDF, текстовый слой располагается только под изображение, поэтому он не может исправить саму картинку. в отличие от PDF, где текст можно класть как под картинку (и тогда картинка остается с теми дефектами, которые имелись), либо над картинкой, тогда все дефекты картинки по тексту исчезают (можно вообще написать свое и выдать за подлинный текст!). Вы же столкнулись с явлением, которое, как я описал ранее, заключено в самой технологии сжатия изображения djvu. И никакие текстовые слои здесь ни при чем! Еще раз говорю, эта проблема известна давно и решается она только одним способом: создание изображений, которые надо потом конвертировать в djvu, высокого качества и разрешения, тогда никаких ошибок не будет! Тот, кто это знает, так и поступает, а кто не знает, получает то, что имеете Вы. AABBYY запантетовала свой движок на OCR, поскольку в итоге их работа оказалась самой качественной в мире. Это признают пользователи из-за рубежа, потому и их программа получали широкое распространение. Google может у них не покупать лицензию, но потому их детище по OCR стало известно Вам, каким-то образом, и пользователям СК. Но знающие это обстоятельство, будут предпочитать использовать FR. И текстовый слой, созданный FR, потом с помощью программ отдельных разработчиков (а их уже много) затем подкладывать его под изображение в djvu. А потому, если Вы ручками не исправите Вашу картинку с текстом djvu, то все эти огрехи так и будут видны, хотя поиск будет по тексту проводиться правильно, и даже копироваться правильно, чтобы потом его перенести в другие программы текстовых редакторов. Добавлено: niccolo Цитата: Распознаёте текст. Сохраняете в ПДФ а затем правите в ФР 15 поиском и заменой. Исправленный текст FR будет заемнять на печатный. | Вы также ошибаетесь, потому что править текстовый слой после распознавания можно в FR только до создания PDF, так как создание PDF - это заключительный этап, после которого редактировать, достаточно ограниченно, можно лишь в других программах, но это костыли для инвалида, хорошо отредактировать такой PDF весьма сложно, если, в ряде случаев, вообще возможно. То, что Вы предлагает, приведет его к тому, что открыв PDF в FR15, программа снова его попросит распознать страницы, затем их проверить и отредактировать, а потом уже этот слой можете использовать либо в djvu, либо в PDF. Добавлено: niccolo Цитата: Исправленный текст FR будет заемнять на печатный. | Кстати, а иного, кроме как "печатного" текста FR и не создает, и ничего он не заменяет, а просто подкладывает этот печатный текст либо под изображение, либо над изображением, а результат визуальный будет разный! Хотя в обоих случаях поиск по тексту и копирование текста будет присутствовать. Добавлено: Уважаемый daa2013 Я все наслаждаюсь Вашим литературным шедевром, и все же, не откладывая в долгий ящик, решил сейчас спросить: у Вас при освещении работы DK, освещены все опции кроме одной - "Autolevels". Пожалуйста, объясните, с чем ее едят и под каким соусом, да, и каким прибором: ложкой или вилкой? |