PDF в Word
онлайн
Конвертируйте PDF в редактируемые документы Word. Разметка и таблицы сохраняются — документ не покидает браузер.
Убедитесь сами: откройте DevTools → вкладку Network → перетащите файл. Никаких загрузок на сервер не произойдёт.
Три шага. Ноль загрузок.
Перетащите PDF
Файл загружается в память браузера.
Конвертация в браузере
Текст, таблицы и форматирование извлекаются локально.
Скачайте DOCX
Откройте в Word или любом редакторе. Исходный PDF остаётся нетронутым.
Когда нужно сконвертировать PDF в Word
Самая частая причина — нужно отредактировать документ, а есть только PDF. Кто-то прислал договор, отчёт или служебную записку, и места, которые нужно поменять, разбросаны по всему файлу — поправить опечатку, обновить даты, заменить абзац на исправленный. Делать это прямо в PDF-редакторе можно, но если переписывать много, открыть файл в Word — быстрее и удобнее.
Другие частые причины: вытащить абзацы, чтобы вставить их в другой документ; скопировать раздел в тело письма; перевёрстать резюме, пришедшее в PDF, под другую вакансию; переиспользовать куски научной статьи. Везде, где нужно достать текст из PDF и положить его в редактируемый формат, — это та самая конвертация.
Что эта конвертация умеет и чего не умеет
Инструмент извлекает текст из PDF и собирает Word-документ. На практике результат сильно зависит от того, что у вас за PDF.
- Текстовые PDF конвертируются хорошо. Если PDF был сделан экспортом из Word, через «Сохранить как PDF» в любом приложении, или системой, выдавшей его напрямую (биллинг, генератор отчётов), — текст внутри PDF действительно текст, и инструмент его читает чисто. На выходе Word с выделяемыми, редактируемыми абзацами.
- Сканированные PDF возвращаются абзацами только при наличии OCR-слоя. Чистый скан без OCR — это просто картинки страниц, никакого текста. Если PDF сканированный, но уже с OCR (многие современные сканеры и облачные сервисы добавляют слой автоматически), инструмент прочтёт его и выдаст текст. Если это сырой скан без OCR — Word будет пустой или почти. В таком случае сначала прогоните PDF через OCR-инструмент.
- Восстановление макета хорошо для прозы, хуже для сложных вёрсток. Инструмент определяет основной текст и заголовки, анализируя размеры шрифтов и группируя текст по строкам. Для обычного документа — абзацы, заголовки, списки, простые таблицы — это работает. Для многоколоночных макетов, сносок вокруг картинок, врезок с плавающим текстом — текст попадёт примерно в правильном порядке, но без оригинальной вёрстки.
- Картинки в Word сейчас не извлекаются. Инструмент сосредоточен на тексте. Если в PDF есть фото, графики или схемы, которые нужны и в Word, придётся извлечь их отдельно (открыть PDF, сделать скриншот, вставить в Word) или использовать другую конвертацию.
Что с форматированием
Инструмент старается сохранить то, что переносится надёжно:
- Заголовки и основной текст распознаются по размеру шрифта — текст значительно больше тела помечается как заголовок в Word.
- Разрывы абзацев определяются по межстрочному интервалу, и абзацы в Word соответствуют абзацам в PDF.
- Размеры шрифтов на уровне фрагментов сохраняются примерно — текст 14pt в PDF будет около 14pt в Word.
Что сложнее и почему:
- Жирный и курсив требуют, чтобы PDF действительно использовал жирный или курсивный шрифт (а не обычный, который рендерер чуть утолщил). Многие PDF кодируют это корректно; некоторые — нет.
- Таблицы со сложным объединением ячеек или вложенные таблицы обычно «уплощаются» в линейные абзацы. Простые таблицы переносятся лучше сложных.
- Исходные шрифты упоминаются по возможности, но если у вас на компьютере их нет, Word подставит свои. Содержимое верное; визуально может отличаться.
Практические заметки
- Если у PDF есть пароль, сначала снимите. Прогоните через unlock-pdf перед конвертацией — зашифрованные PDF нельзя открыть для извлечения текста.
- Для длинных PDF конвертация занимает время. 200-страничный документ нужно разобрать постранично, сгруппировать строки в абзацы, собрать .docx. На обычном ноутбуке — около минуты. Будьте терпеливы при первом запуске.
- Цикл с потерями. Если взять Word, конвертировать в PDF (инструментом, который запекает вёрстку в картинки), а потом этот PDF обратно в Word — второй Word будет заметно хуже первого. Исходный .docx, если он где-то ещё есть, всегда чище. Этот инструмент — для случаев, когда оригинала нет.
- Если нужен только текст, а не Word-файл, см. pdf-to-txt. Быстрее и даёт чистый текст, который можно вставить куда угодно.
Что происходит с файлом
Ваш PDF читается в память браузера, разбирается на текст и макет прямо там, и локально превращается в .docx. Полученный Word-файл предлагается на скачивание; никаких загрузок, никакой сервер ваш документ не обрабатывает. Можете проверить: откройте DevTools, наблюдайте Network во время конвертации — увидите, что исходящих запросов с содержимым файла нет.
Частые вопросы
Загружается ли мой PDF на сервер?
Нет. Конвертация происходит целиком в вашем браузере. Файл не покидает устройство.
Сохраняются ли таблицы и форматирование?
Да. Таблицы, списки, заголовки и большая часть форматирования абзацев переносятся в DOCX. Сложные макеты могут слегка сместиться.
Конвертируются ли сканы (OCR)?
Сканы нужно пропустить через OCR, чтобы получить редактируемый текст. «Цифровые» PDF (экспорт из Word, InDesign и т. п.) конвертируются чисто.
Справляется ли со сложной разметкой?
Колонки, сноски и текстовые блоки аппроксимируются. Для идеального совпадения сверяйте DOCX с исходником после конвертации.