Редактирование PDF файлов (часть 1) - [200] :: Программы :: Компьютерный форум Ru.Board
Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)

Модерирует : gyra, Maz

Maz (05-04-2025 09:00): Редактирование PDF файлов (часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого [?]
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay) [?]
О технологии MRC с примерами - 1, 2 [?]
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF [?]
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1 [?], 2 [?]
Редактировать текст - PDF-XChange Editor [?], Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, SoftMaker FlexiPDF, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro [?]
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: 73, 07:30 20-03-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Vasily_Koshkin

Цитата:
Я правильно понимаю

Нет. Неправильно. Я отвечал на вопрос, который вы задали - про софт для извлечения.

Цитата:
преобразовать эти файлы в доступный Акробату вид, не потеряв при этом в качестве

У меня Акробата-вьювера-просмотрщика нет (Windows 7 тоже нет), поэтому гарантировать результат не могу. Но.
Если дело заключается в каком-то глюке, связанном с обработкой jpeg2000 в Акробате, то я вижу 2 быстрых выхода:
1) преобразовать все jpeg2000-картинки внутри pdf в обычный jpg
2) преобразовать страницы полностью в jpg-картинки по одному изображению на страницу, а не по 3 как сейчас. Т.е. растеризовать страницы.
И 1-й и 2-й методы влекут за собой увеличение размера файлов в Мбайтах.
Есть ещё небыстрые выходы - типа полного OCR с вычиткой в FineReader.
Потеря качества - понятие весьма субъективное, зависящее также от режима просмотра файлов. Также надо учитывать, что качество исходных файлов весьма посредственное.
 
Сначала надо выяснить, дело ли в jpeg2000. Вот архив, где 2 ваших файла, обработанных по 1-му методу. Один с нормальным OCR. Проверяйте. Если после всех проверок результат удовлетворит, то тогда можно будет огласить подробный рецепт.
 
 

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 14:18 04-04-2025 | Исправлено: jourmager, 14:57 04-04-2025
Vasily_Koshkin



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager

Цитата:
 дело заключается в каком-то глюке, связанном с обработкой jpeg2000 в Акробате,


Цитата:
1) преобразовать все jpeg2000-картинки внутри pdf в обычный jpg


Цитата:
2 ваших файла, обработанных по 1-му методу.

Да, оба файла открылись без проблем, даже с "родной" dll-кой, неконтролируемых вылетов пока не было.  
 
PS. В смежной теме писали что-то про перекодировку цвета в PDF-XChange Editor:
http://forum.ru-board.com/topic.cgi?forum=5&topic=51310&start=260#18 [?]  
http://forum.ru-board.com/topic.cgi?forum=5&topic=51310&start=260#19 [?]  
Результата, правда, не приложили.

Всего записей: 1453 | Зарегистр. 07-02-2004 | Отправлено: 16:50 04-04-2025 | Исправлено: Vasily_Koshkin, 16:52 04-04-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Внимание! Данный метод с использование PDF-XChange Editor приводит к самопроизвольному увеличению размера JBIG2-маски в килобайтах, что приводит к увеличению общего размера pdf-файла.
По возможности лучше пользоваться методом от los с использованием 3-Heights pdfoptimize [?]
pdfoptimize -ff -fc 1 input.pdf output.pdf

 
Vasily_Koshkin
Исправление проблемы вылета Adobe Acrobat на pdf-файлах, которые сделаны с использованием технологии MRC, из-за возможных проблем с файлом P2KLib.dll из комплекта Adobe Acrobat, путём перекодирования изображений в формате jpeg2000 в обычный jpg с помощью программы PDF-XChange Editor.  
Также это можно использовать для преобразования-рекомпресии изображений одного формата в другой формат.
 
1) Найти PDF-XChange Editor в соответствующей теме [?], например такой [?]
Предупреждаю, использование самодельных портабельных сборок PDF-XChange Editor от некоторых авторов может иметь непредсказуемые последствия. Обычно используют "модифицированные" фирменные портабельные варианты.
2) Открыть копию требуемого pdf-файла
3) Открыть вертикальную панель Content слева путём нажатия на иконку Content на левой вертикальной панели кнопок (8-я сверху) - она слева от главного окна со страницей файла. Откроется список страниц, где каждая страница содержит элементы из которых она состоит.
3-доп) Необязательное, но познавательное. Открыть содержимое какой-либо страницы (где-то из середины файла, потому что обложки обычно отличаются) нажатием стрелки ">", откроется содержимое страницы
В данном случае (PDF MRC) видим, что страница состоит из 2 изображений - верхнее по списку - jpeg2000 - это фон (иллюстрации), и нижнее по списку (текст).
Открываем окно Recompress Image. Стать мышкой на какое-либо изображение и нажать ПКМ. В выпавшем контекстном меню выбрать Recompress Image (3-е снизу). Откроется окно Recompress Image, в котором в окошке Image Details можно посмотреть параметры текущего изображения (Current Image): размеры в пикселях, битность цвета, цветовое пространство, значение dpi, размер изображения в кило-мега-байтах, формат сжатия.
Параметры изображения (Compressed Image), которое будет получено после рекомпрессии - зависят от настроек.
В окне Recompress Image будет видно, что нижнее по списку изображение в свою очередь состоит из 2 изображений, которые видны в окошке Image Details (сначала обычно с прокруткой) - JPEG2000 (цветовая маска текста) и JBIG 2 (сам текст).  
Для лучшего восприятия составных изображений желательно растянуть окно Recompress Image по вертикали.
4) Стать мышкой на какую-либо страницу, нажать ПКМ и вызвать контекстное меню.
5) В контекстном меню выбрать Select -> Images. После этого в левой панели Content будут выбраны все изображения в pdf-файле
6-1) Аккуратно подвести мышку к выделенным изображениям (чтобы не скинуть выделение всех изображений) и нажать ПКМ. В выпавшем контекстном меню выбрать Recompress Images - откроется окно Recompress Images
6-2) Второй вариант - в верхнем меню выбрать Convert -> Recompress Images. Далее по смыслу
7) В окне Recompress Images настроить параметры рекомпрессии: выбрать-подсветить нужный формат (True Color, Grayscale, Indexed, Monochrome, Mask, Softmask) и нажать кнопку Edit для него
8) Т.к. нас интересует перекодировка полноцветных jpeg2000 в jpg, то для формата True Color выбираем такие параметры:
Convert to -> No Conversion
Compress Method -> JPEG
JPEG Quality -> Medium или High
Downsampling -> No Downsampling
Нажимаем ОК
9) Для всех остальных форматов выбираем
Convert to -> No Conversion
Compress Method -> Keep Existing
Downsampling -> No Downsampling
10) В окне Recompress images убеждаемся в правильности настроек всех форматов и нажимаем ОК
11) Ждем минуту-две и более в зависимости от количества страниц и параметров изображений
12) Профит
 
Если кто-то знает программу. где можно провернуть такое же - отзовитесь!

----------
Заповеди ru-board: не плоди темы, поиск в теме -> версия для печати, # или под ковриком -> Редактировать, стандартный пароль -> FAQ ru-board, большой текст -> под кат

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 22:24 04-04-2025 | Исправлено: jourmager, 03:16 05-04-2025
los

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
jourmager, 3-Heights pdfoptimize
pdfoptimize -ff -fc 1 'Алгебра - 7-9 - Универсальный многоуровневый сборник (Ященко, Шестаков).pdf' file.pdf
https://workupload.com/file/GRKxdYPxp6D

Всего записей: 7862 | Зарегистр. 08-09-2001 | Отправлено: 23:24 04-04-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Спасибо дважды.
1)
Цитата:
3-Heights pdfoptimize
pdfoptimize -ff -fc 1 input.pdf output.pdf

2) Благодаря вам обнаружился очень неприятный баг в PDF-XChange Editor - при групповой или одиночной рекомпресии составных изображений, имеющих маску, при установке параметров маски Convert to -> No Conversion, Compress Method -> Keep Existing, Downsampling -> No Downsampling, т.е. маска должна оставаться без изменений, всё равно происходит какое-то преобразование JBIG2-изображений (mask/softmask) с увеличением размера этих изображений в килобайтах от нескольких процентов до 3 раз, соответственно увеличивается и общий размер pdf-файла в мегабайтах.
 
Оффтоп.
Кто-то может подсказать, какого чёрта у меня в предыдущем сообщении наконец-то появилась подпись, первый раз за 800 сообщений? И снова пропала.

Всего записей: 945 | Зарегистр. 04-11-2019 | Отправлено: 03:25 05-04-2025 | Исправлено: jourmager, 03:33 05-04-2025
galina2000

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. Поступили билингвальные документы в pdf, страница на английском, следом страница с тем же текстом на французском. Эта последовательность сбивается на чертежах (они только на англ.) и таблицах (2-3 страницы подряд на англ., затем 2-3 стр. на французском). Как можно пакетно удалить из этих документов все страницы на французском языке? Спасибо

Всего записей: 533 | Зарегистр. 21-08-2006 | Отправлено: 05:22 05-04-2025
Maz



Дед Мазай
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов (часть 2) [?]

----------
Я прав! Если не прав
Любимое занятие форумчан - экстраполировать свой частный случай на большинство. И чем экзотичнее случай - тем глобальнее выводы

Всего записей: 39337 | Зарегистр. 26-02-2002 | Отправлено: 09:00 05-04-2025
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)
Maz (05-04-2025 09:00): Редактирование PDF файлов (часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru