PDF в Word

PDF в Word
онлайн

Конвертируйте PDF в редактируемые документы Word. Разметка и таблицы сохраняются — документ не покидает браузер.

Перетащите PDF
Текст и структура становятся редактируемыми в Word.

Убедитесь сами: откройте DevTools → вкладку Network → перетащите файл. Никаких загрузок на сервер не произойдёт.

Разметка сохранена После первой загрузки работает офлайн
Бесплатно
Без регистрации
Без загрузки
Сохранение разметки
КАК ЭТО РАБОТАЕТ

Три шага. Ноль загрузок.

1

Перетащите PDF

Файл загружается в память браузера.

2

Конвертация в браузере

Текст, таблицы и форматирование извлекаются локально.

3

Скачайте DOCX

Откройте в Word или любом редакторе. Исходный PDF остаётся нетронутым.

Когда нужно сконвертировать PDF в Word

Самая частая причина — нужно отредактировать документ, а есть только PDF. Кто-то прислал договор, отчёт или служебную записку, и места, которые нужно поменять, разбросаны по всему файлу — поправить опечатку, обновить даты, заменить абзац на исправленный. Делать это прямо в PDF-редакторе можно, но если переписывать много, открыть файл в Word — быстрее и удобнее.

Другие частые причины: вытащить абзацы, чтобы вставить их в другой документ; скопировать раздел в тело письма; перевёрстать резюме, пришедшее в PDF, под другую вакансию; переиспользовать куски научной статьи. Везде, где нужно достать текст из PDF и положить его в редактируемый формат, — это та самая конвертация.

Что эта конвертация умеет и чего не умеет

Инструмент извлекает текст из PDF и собирает Word-документ. На практике результат сильно зависит от того, что у вас за PDF.

  • Текстовые PDF конвертируются хорошо. Если PDF был сделан экспортом из Word, через «Сохранить как PDF» в любом приложении, или системой, выдавшей его напрямую (биллинг, генератор отчётов), — текст внутри PDF действительно текст, и инструмент его читает чисто. На выходе Word с выделяемыми, редактируемыми абзацами.
  • Сканированные PDF возвращаются абзацами только при наличии OCR-слоя. Чистый скан без OCR — это просто картинки страниц, никакого текста. Если PDF сканированный, но уже с OCR (многие современные сканеры и облачные сервисы добавляют слой автоматически), инструмент прочтёт его и выдаст текст. Если это сырой скан без OCR — Word будет пустой или почти. В таком случае сначала прогоните PDF через OCR-инструмент.
  • Восстановление макета хорошо для прозы, хуже для сложных вёрсток. Инструмент определяет основной текст и заголовки, анализируя размеры шрифтов и группируя текст по строкам. Для обычного документа — абзацы, заголовки, списки, простые таблицы — это работает. Для многоколоночных макетов, сносок вокруг картинок, врезок с плавающим текстом — текст попадёт примерно в правильном порядке, но без оригинальной вёрстки.
  • Картинки в Word сейчас не извлекаются. Инструмент сосредоточен на тексте. Если в PDF есть фото, графики или схемы, которые нужны и в Word, придётся извлечь их отдельно (открыть PDF, сделать скриншот, вставить в Word) или использовать другую конвертацию.

Что с форматированием

Инструмент старается сохранить то, что переносится надёжно:

  • Заголовки и основной текст распознаются по размеру шрифта — текст значительно больше тела помечается как заголовок в Word.
  • Разрывы абзацев определяются по межстрочному интервалу, и абзацы в Word соответствуют абзацам в PDF.
  • Размеры шрифтов на уровне фрагментов сохраняются примерно — текст 14pt в PDF будет около 14pt в Word.

Что сложнее и почему:

  • Жирный и курсив требуют, чтобы PDF действительно использовал жирный или курсивный шрифт (а не обычный, который рендерер чуть утолщил). Многие PDF кодируют это корректно; некоторые — нет.
  • Таблицы со сложным объединением ячеек или вложенные таблицы обычно «уплощаются» в линейные абзацы. Простые таблицы переносятся лучше сложных.
  • Исходные шрифты упоминаются по возможности, но если у вас на компьютере их нет, Word подставит свои. Содержимое верное; визуально может отличаться.

Практические заметки

  1. Если у PDF есть пароль, сначала снимите. Прогоните через unlock-pdf перед конвертацией — зашифрованные PDF нельзя открыть для извлечения текста.
  2. Для длинных PDF конвертация занимает время. 200-страничный документ нужно разобрать постранично, сгруппировать строки в абзацы, собрать .docx. На обычном ноутбуке — около минуты. Будьте терпеливы при первом запуске.
  3. Цикл с потерями. Если взять Word, конвертировать в PDF (инструментом, который запекает вёрстку в картинки), а потом этот PDF обратно в Word — второй Word будет заметно хуже первого. Исходный .docx, если он где-то ещё есть, всегда чище. Этот инструмент — для случаев, когда оригинала нет.
  4. Если нужен только текст, а не Word-файл, см. pdf-to-txt. Быстрее и даёт чистый текст, который можно вставить куда угодно.

Что происходит с файлом

Ваш PDF читается в память браузера, разбирается на текст и макет прямо там, и локально превращается в .docx. Полученный Word-файл предлагается на скачивание; никаких загрузок, никакой сервер ваш документ не обрабатывает. Можете проверить: откройте DevTools, наблюдайте Network во время конвертации — увидите, что исходящих запросов с содержимым файла нет.

FAQ

Частые вопросы

Загружается ли мой PDF на сервер?

Нет. Конвертация происходит целиком в вашем браузере. Файл не покидает устройство.

Сохраняются ли таблицы и форматирование?

Да. Таблицы, списки, заголовки и большая часть форматирования абзацев переносятся в DOCX. Сложные макеты могут слегка сместиться.

Конвертируются ли сканы (OCR)?

Сканы нужно пропустить через OCR, чтобы получить редактируемый текст. «Цифровые» PDF (экспорт из Word, InDesign и т. п.) конвертируются чисто.

Справляется ли со сложной разметкой?

Колонки, сноски и текстовые блоки аппроксимируются. Для идеального совпадения сверяйте DOCX с исходником после конвертации.