CaptainFlint
Gold Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору P0wder Цитата: Гадать нечего. В первоначальном сообщении было написано, что pdf'ы распознанные. Это означает, что "Выделить все/Копировать" , открываете любой редактор, "Вставить" и получаете полноценный текст, а не картинки. | А я думал, что по-русски пишу… Последний раз попытаюсь объяснить. Наличие распознанного текста в PDF не означает, что этот текст хранится там в виде самого себя. Грубо говоря, если распознанный текст содержит слово "test", то внутри файла эта строчка может быть записана, например, как "%74%65%73%74": то есть запись не буквами t, e, s, t, а их шестнадцатеричными кодами. Любая программа просмотра PDF знает об этих внутренних хитростях и преобразовывает эти коды в символы, после чего отображает получившийся текст, позволяет выделять его, копировать и так далее. А Тотал так не умеет. Он открывает файл и читает строго то, что там внутри находится, без какой-либо интерпретации, без преобразований. Он видит последовательность символов %74%65%73%74, пытается найти здесь подстроку "test". Её здесь, разумеется, нет, и Тотал помечает файл как не содержащий нужную строку. Проще некуда. (Естественно, все примеры кодирования условны.) VSHY Цитата: Общался с этими товарисчами и явно не в восторге от общения. Я уважаю людей, которые помогают друг другу и сам стараюсь помогать по мере сил, но там увидел только надутость от собственной важности. | Могу только сказать, что это впечатление глубоко ошибочно. Впрочем, если даже фраза "это очень трудно сделать" сразу же оценивается как "надутость от собственной важности", то все аргументы, которые я смог бы привести, будут бессильны.
---------- Почему же, ё-моё, ты нигде не пишешь "ё"? |
| Всего записей: 5554 | Зарегистр. 11-11-2002 | Отправлено: 01:47 02-06-2012 | Исправлено: CaptainFlint, 01:49 02-06-2012 |
|