sabio
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Mushroomer проблема, по большей части не в том, что pdf закрытый формат, а в том, что он семантически "совсем другой" каждый кусочек текста там - отдельный блок, т.е. если абзац занимает 5 строк, например, то каждая из них будет отдельным, независимым блоком, никак не связанным с предыдущим читать-писать его куча не-адобовских прог умеет манипуляции на уровне страниц (удалить, вставить и пр.) тоже не проблема - см. pdftk, например а вот превратить его "обратно в текст" - это задача гораздо сложнее, особенно если текст свёрстан в две колонки или ещё как-нть "непросто" это уже нужен какой-нть FineReader с его детектором абзацев и колонок для аналогии: всякие MS Office / OOo работают с "куском ткани" и текущей "моделью раскройки" - на ходу применяют вторую к первой и показывают результат (страницы, строки, колонтитулы и пр.) а при рендеринге в pdf эта самая "раскройка" применяется намертво, навсегда - и в файле хранятся уже отдельные кусочки без всякой связи друг с другом и собрать это обратно, восстановить "что где было", на самом деле, совсем не просто |