реклама
Программное обеспечение

Утилиты конвертирования PDF-документов в форматы Word и Excel

⇣ Содержание
Вся техническая документация сегодня поставляется в формате PDF, для просмотра документов в котором используется бесплатная утилита Adobe Acrobat Reader. Но довольно часто возникает необходимость воспользоваться какими-то фрагментами PDF-файлов при подготовке собственных документов или даже отредактировать материалы в PDF-формате, например, статью, контракт, отчет и т.п. В первом случае потребуется извлечь из PDF-файлов фрагменты текста и/или изображения. Теоретически, это обычно можно сделать и встроенными средствами Acrobat Reader, но нередко с посредственным результатом. Во втором случае придется конвертировать PDF-документы в редактируемый формат (например, MS Word) с сохранением оформления исходного документа, что в программе Acrobat Reader не предусмотрено. Существуют два варианта решения проблемы - установить программу-конвертер, которая обеспечит преобразование PDF-документов в формат MS Word и/или MS Excel, либо воспользоваться специальным онлайновым сервисом. На использовании утилит такого плана мы, в основном, и остановимся в данной статье. Что касается онлайновых сервисов, то в качестве примеров можно привести Pdftoword.com компании Nitro PDF Software и Zamzar.com компании Zamzar. С их помощью осуществить конвертирование PDF-документов проще простого - нужно лишь указать в поле "Step1" интересующий PDF-файл, в поле "Step2" выбрать нужный вам формат, ввести в поле "Step3" свой адрес электронной почты и щелкнуть на кнопке "Convert". Сервис любезно сообщит о том, что файл принят, и через некоторое время на свой почтовый ящик вы получите вожделенный Word-документ (на первом из названных сервисов), либо ссылку на него (на втором сервисе).
 1_s.jpg
Онлайн-сервис Pdftoword.com умеет преобразовывать PDF-документы в форматы DOC или RTF, а результаты его конвертирования просто идеальны - никаких прямоугольных блоков с отдельными фрагментами текста, что нередко можно наблюдать после работы ряда программ-конвертеров. Правда, в сети имеются замечания пользователей об иногда некорректном преобразовании этим сервисом документов с кириллицей, однако в нашем случае такой проблемы отмечено не было. Ниже приведен пример исходного PDF-документа и полученный на его основе DOC-файл.
 2_s.jpg
Сервис Zamzar.com может использоваться не только для конвертирования PDF-файлов в форматы DOC или RTF, но и других преобразований файлов, скажем, изображений и музыки из одного формата в другой, и поддерживает пакетный режим обработки данных. Однако полученные с его помощью из PDF-файлов Word-документы имеют несколько худшее качество, чем после обработки на Pdftoword.com, поскольку в них присутствуют прямоугольные блоки данных. Но все равно, для бесплатного решения вариант достаточно неплох.
 3_s.jpg

#ABBYY PDF Transformer 3.0

Разработчик: ABBYY Software
Размер дистрибутива: 220 Мб
Распространение: условно бесплатная ABBYY PDF Transformer - профессиональное решение для конвертирования PDF-документов в форматы документов Microsoft Word и Microsoft Excel, а также в HTML и TXT-файлы. Программа умеет конвертировать любые PDF-файлы, включая файлы без текстового слоя (такие файлы чаще всего получаются из отсканированных документов и представляют собой изображение текста) и корректно обрабатывает PDF-файлы, содержащие любые комбинации поддерживаемых языков, которых всего 184, включая, русский и английский. При необходимости, возможно выборочное конвертирование отдельных страниц или даже конкретных их фрагментов. Утилита точно сохраняет оформление исходного документа (картинки, таблицы, расположение колонок, ссылки) и позволяет управлять вариантами конвертирования и сохранения. Например, можно четко определить области, которые должны восприниматься программой как текст или как изображения (что может быть актуальным для PDF-файлов со сложным оформлением), сохранить готовый документ с таким же оформлением, как в оригинале, или как колонку текста (с картинками или без - по желанию) и т.д. Кроме того, программа может использоваться для создания PDF-документов напрямую из приложений Microsoft Office, любых приложений, поддерживающих вывод документов на печать, а также из проводника Windows одним щелчком мыши. Вдобавок она может применяться для объединения нескольких файлов различного формата в один PDF-документ. Демо-версия программы (имеется русскоязычная локализация) работоспособна в течение 15 дней и позволяет конвертировать не более 50 PDF-документов и не более двух страниц за один раз. Количество PDF-файлов, создаваемых во время испытательного периода, не ограничено, но все они будут иметь специальную отметку. Стоимость коммерческой версии зависит от варианта приобретения: коробочная версия - 1490 руб., версия для скачивания - 1340 руб. В ABBYY PDF Transformer предусмотрено несколько способов конвертирования PDF-документов в документы MS Office. Можно запустить конвертер и для конвертирования в документ Word нажать кнопку "Открыть PDF", затем в открывшемся окне выбрать файл для конвертирования. Если PDF-документ защищен паролем, то программа запросит пароль. Затем в списке форматов, в которые может быть произведено конвертирование, нужно выбрать вариант "Конвертировать в документ Microsoft Word". При необходимости, можно изменить имя файла и папку для его сохранения, для чего следует нажать на ссылку "Изменить". Тут же можно настроить дополнительные параметры в группе "Дополнительные опции". В частности, выбрать режим сохранения оформления:
  • "Как в оригинале" - позволяет получить документ, внешний вид которого будет полностью идентичен оригиналу;
  • "В одну колонку" - обеспечивает полное восстановление конвертируемого текста (с учетом разбиения на абзацы, начертания и размера шрифта), однако оформление оригинала при этом воспроизведено не будет.
Также можно включить/отключить флажок "Сохранять картинки", для того чтобы иллюстрации при конвертировании сохранялись (это увеличивает размер получаемого файла) либо нет.
 4_s.jpg
После этого осталось щелкнуть на кнопке "Конвертировать" и получить готовый Word-документ, который будет автоматически открыт. Никакого дополнительного редактирования в полученном документе не потребуется, поскольку преобразование производится очень качественно.
 5_s.jpg
Если требуется конвертировать не весь документ, а отдельные страницы, то их можно выделить в окне "Страницы" (оно в правой части главного окна) и из контекстного меню выбирать команду "Конвертировать выбранные страницы". Для выборочного конвертирования PDF-файлов в таблицы Excel надо действовать несколько иначе. Вначале открыть исходный PDF-файл, потом найти в нем страницу с таблицей, выделить мышью область с таблицей и определить данную область в качестве таблицы (команда "Область Таблица" из контекстного меню). Затем активировать из контекстного меню, на этот раз вызванного на странице в окне "Страницы", команду "Конвертировать выбранные страницы".
 6_s.jpg
Полученная таблица будет сформирована и открыта в Excel.
 7_s.jpg
Если требуется сохранить все таблицы из PDF-документа в файл Excel, то выделять их не нужно, а следует выбрать в списке форматов вариант "Конвертировать в документ Microsoft Excel". Затем в группе "Дополнительные опции" надо включить флажок "Игнорировать текст вне таблицы" и щелкнуть на кнопке "Конвертировать". Все таблицы из документа будут помещены на одном листе друг за другом.
 8_s.jpg
Извлечение изображений теоретически также возможно, но реализовано неудобно - картинки придется по очереди выделять и копировать через буфер обмена, то есть никакого преимущества перед копированием изображений из Acrobat Reader не наблюдается. Иными словами, извлечь и сохранить в виде графических файлов картинки с выделенных страниц, либо всего документа, невозможно. Есть возможность запускать процесс конвертирования PDF-документов из проводника Windows (команда "ABBYY PDF Transformer" > "Открыть в Microsoft Word" из контекстного меню). Кроме того, теоретически, можно запускать преобразование PDF-документа и не отрываясь от работы в Word или Excel, поскольку после установки конвертера в них интегрируется панель инструментов, на которой присутствует кнопка "Конвертировать PDF". Правда, щелчок по этой кнопке просто приводит к открытию конвертера и ничему более, что и понятно, ведь указать исходный PDF-файл и настроить процесс конвертирования все равно необходимо вручную.
Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
window-new
Soft
Hard
Тренды 🔥
Миллионер с мизерной зарплатой: выяснилась, сколько зарабатывает глава OpenAI 2 мин.
Рекордная скидка и PvP-режим Versus обернулись для Warhammer: Vermintide 2 полумиллионом новых игроков за неделю 6 мин.
Роскомнадзор с декабря начнёт блокировать сайты за публикацию научной информации о VPN для обхода блокировок 14 мин.
Новый трейлер раскрыл дату выхода Mandragora — метроидвании с элементами Dark Souls и нелинейной историей от соавтора Vampire: The Masquerade — Bloodlines 2 ч.
В Японии порекомендовали добавить в завещания свои логины и пароли 3 ч.
Обновления Windows 11 больше не будут перезагружать ПК, но обычных пользователей это не касается 3 ч.
VK похвасталась успехами «VK Видео» на фоне замедления YouTube 5 ч.
GTA наоборот: полицейская песочница The Precinct с «дозой нуара 80-х» не выйдет в 2024 году 7 ч.
D-Link предложила устранить уязвимость маршрутизаторов покупкой новых 7 ч.
Valve ужесточила правила продажи сезонных абонементов в Steam и начнёт следить за выполнением обещаний разработчиков 8 ч.
Представлена технология охлаждения чипов светом — секретная и только по предварительной записи 2 ч.
Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии 2 ч.
Грузовик «Прогресс МС-29» улетел к МКС с новогодними подарками и мандаринами для космонавтов 3 ч.
Meta планирует построить за $5 млрд кампус ЦОД в Луизиане 3 ч.
Arm задаёт новый стандарт для ПК, чтобы навязать конкуренцию x86 4 ч.
HPE готова ответить на любые вопросы Минюста США по расследованию покупки Juniper за $14 млрд 4 ч.
Thermaltake представила компактный, но вместительный корпус The Tower 250 для игровых систем на Mini-ITX 5 ч.
Флагманы Oppo Find X8 и X8 Pro на Dimensity 9400 стали доступны не только в Китае — старший оценили в €1149 6 ч.
«ВКонтакте» выросла до 88,1 млн пользователей — выручка VK взлетела на 21,4 % на рекламе 6 ч.
В Китае выпустили жидкостный кулер с 6,8-дюймовым изогнутым OLED-экраном за $137 6 ч.