ScanKromsator | СканКромсатор (Часть 4) - [74] :: Программы

SVN75
Вы заблуждаетесь! Я Вас прекрасно понял, но, к сожалению, Вы не совсем правильно понимаете процесс создания djvu. Не буду говорить за последнее, может быть компания Лизард, являющаяся автором этой удивительной технологии, в последних своих программах ввела возможность при создании djvu одновременно и создавать текстовый слой OCR, но на момент создания версии их программы Document Express Editor 6.0.1 Build 1320 такой возможности нет! Суть их технологии заключается в оригинальной возможности сжатия графических изображений максимально возможной степени с незначительными потерями качества или без такового, но выходной размер будет в разы больший. Если применять сжатие, то их технология раза в два и более обгоняет технологию AABBYY в PDF.

Текстовый слой создается отдельно рамными программами, в том числе, не только FR, но и Tesseract (и здесь вопрос только в качестве распознавания). Но, в djvu, в отличие от PDF, текстовый слой располагается только под изображение, поэтому он не может исправить саму картинку. в отличие от PDF, где текст можно класть как под картинку (и тогда картинка остается с теми дефектами, которые имелись), либо над картинкой, тогда все дефекты картинки по тексту исчезают (можно вообще написать свое и выдать за подлинный текст!).

Вы же столкнулись с явлением, которое, как я описал ранее, заключено в самой технологии сжатия изображения djvu. И никакие текстовые слои здесь ни при чем!

Еще раз говорю, эта проблема известна давно и решается она только одним способом: создание изображений, которые надо потом конвертировать в djvu, высокого качества и разрешения, тогда никаких ошибок не будет! Тот, кто это знает, так и поступает, а кто не знает, получает то, что имеете Вы.

AABBYY запантетовала свой движок на OCR, поскольку в итоге их работа оказалась самой качественной в мире. Это признают пользователи из-за рубежа, потому и их программа получали широкое распространение.

Google может у них не покупать лицензию, но потому их детище по OCR стало известно Вам, каким-то образом, и пользователям СК. Но знающие это обстоятельство, будут предпочитать использовать FR. И текстовый слой, созданный FR, потом с помощью программ отдельных разработчиков (а их уже много) затем подкладывать его под изображение в djvu.

А потому, если Вы ручками не исправите Вашу картинку с текстом djvu, то все эти огрехи так и будут видны, хотя поиск будет по тексту проводиться правильно, и даже копироваться правильно, чтобы потом его перенести в другие программы текстовых редакторов.

Добавлено:
niccolo

Цитата:

Распознаёте текст. Сохраняете в ПДФ а затем правите в ФР 15 поиском и заменой. Исправленный текст FR будет заемнять на печатный.

Вы также ошибаетесь, потому что править текстовый слой после распознавания можно в FR только до создания PDF, так как создание PDF - это заключительный этап, после которого редактировать, достаточно ограниченно, можно лишь в других программах, но это костыли для инвалида, хорошо отредактировать такой PDF весьма сложно, если, в ряде случаев, вообще возможно.

То, что Вы предлагает, приведет его к тому, что открыв PDF в FR15, программа снова его попросит распознать страницы, затем их проверить и отредактировать, а потом уже этот слой можете использовать либо в djvu, либо в PDF.

Добавлено:
niccolo

Цитата:

Исправленный текст FR будет заемнять на печатный.

Кстати, а иного, кроме как "печатного" текста FR и не создает, и ничего он не заменяет, а просто подкладывает этот печатный текст либо под изображение, либо над изображением, а результат визуальный будет разный! Хотя в обоих случаях поиск по тексту и копирование текста будет присутствовать.

Добавлено:
Уважаемый daa2013
Я все наслаждаюсь Вашим литературным шедевром, и все же, не откладывая в долгий ящик, решил сейчас спросить: у Вас при освещении работы DK, освещены все опции кроме одной - "Autolevels".
Пожалуйста, объясните, с чем ее едят и под каким соусом, да, и каким прибором: ложкой или вилкой?

Модерирует : gyra, Maz
Maz (14-09-2023 21:57): ScanKromsator \| СканКромсатор (Часть 5)	Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200