PDF в Word
онлайн
Конвертуйте PDF у редаговані документи Word. Верстка та таблиці зберігаються — документ не покидає браузер.
Переконайтеся самі: відкрийте DevTools → вкладку Network → перетягніть файл. Ви побачите, що жодних завантажень на сервер не відбувається.
Три кроки. Нуль завантажень.
Відпустіть PDF
Файл завантажується в пам'ять браузера.
Конвертація в браузері
Текст, таблиці та форматування витягаються локально.
Завантажте DOCX
Відкрийте у Word чи будь-якому редакторі. Оригінальний PDF залишається недоторканим.
Коли потрібно конвертувати PDF у Word
Найчастіша причина — потрібно відредагувати документ, а є тільки PDF. Хтось надіслав договір, звіт чи службову записку, і місця, які потрібно змінити, розкидані по файлу — виправити друкарську помилку, оновити дати, замінити абзац на виправлений. Це можна робити в PDF-редакторі, але якщо переписувати багато, відкрити файл у Word — швидше й зручніше.
Інші часті причини: витягти абзаци, щоб вставити в інший документ; скопіювати розділ у тіло листа; переверстати резюме, що прийшло в PDF, під іншу вакансію; повторно використати шматки наукової статті. Усюди, де треба дістати текст із PDF і покласти в редагований формат, — це та сама конвертація.
Що ця конвертація вміє і чого не вміє
Інструмент витягує текст із PDF і складає документ Word. На практиці результат сильно залежить від того, що у вас за PDF.
- Текстові PDF конвертуються добре. Якщо PDF створено експортом із Word, через «Зберегти як PDF» у будь-якій програмі, або системою, що видала його напряму (білінг, генератор звітів), — текст усередині PDF справді є текстом, і інструмент читає його чисто. На виході Word із виділяемими, редагованими абзацами.
- Скановані PDF повертаються абзацами лише за наявності OCR-шару. Чистий скан без OCR — це лише картинки сторінок, ніякого тексту. Якщо PDF сканований, але вже з OCR (багато сучасних сканерів і хмарних сервісів додають шар автоматично), інструмент прочитає його й видасть текст. Якщо це сирий скан без OCR — Word буде порожній або майже. У цьому випадку спершу прожень PDF через OCR-інструмент.
- Відновлення макета добре для прози, гірше для складних верстань. Інструмент розрізняє основний текст і заголовки, аналізуючи розміри шрифтів і групуючи текст за рядками. Для звичайного документа — абзаци, заголовки, списки, прості таблиці — це працює. Для багатоколоночних макетів, виносок навколо картинок, бічних блоків із плаваючим текстом — текст потрапить приблизно у правильному порядку, але без оригінального макета.
- Зображення зараз не витягуються в Word. Інструмент сфокусований на тексті. Якщо в PDF є фото, графіки або схеми, які потрібні і у Word, доведеться витягти їх окремо (відкрити PDF, зробити скриншот, вставити у Word) або скористатися іншим маршрутом конвертації.
Що з форматуванням
Інструмент намагається зберегти те, що переноситься надійно:
- Заголовки та основний текст розпізнаються за розміром шрифту — текст значно більший за тіло позначається як заголовок у Word.
- Розриви абзаців визначаються за міжрядковим інтервалом, тож абзаци у Word відповідають абзацам у PDF.
- Розміри шрифтів приблизно зберігаються на рівні фрагментів — текст 14pt у PDF буде близько 14pt у Word.
Що складніше і чому:
- Жирний і курсив вимагають, щоб PDF справді використовував жирний або курсивний шрифт (а не звичайний, який рендерер трохи потовщив). Багато PDF кодують це коректно; деякі — ні.
- Таблиці зі складним об'єднанням клітинок або вкладені таблиці зазвичай «уплощуються» в лінійні абзаци. Прості таблиці переносяться краще за складні.
- Початкові шрифти згадуються, де можливо, але якщо у вас на комп'ютері їх немає, Word підставить свої. Зміст правильний; вигляд може відрізнятися.
Практичні нотатки
- Якщо PDF із паролем, спочатку зніміть. Прожень через unlock-pdf перед конвертацією — зашифровані PDF не відкриваються для витягання тексту.
- Для довгих PDF конвертація триває. Документ на 200 сторінок треба розібрати посторінково, згрупувати рядки в абзаци, зібрати .docx. На звичайному ноутбуці — близько хвилини. Будьте терплячі при першому запуску.
- Цикл із втратами. Якщо взяти Word, конвертувати в PDF (інструментом, що запікає верстку в картинки), а потім цей PDF назад у Word — другий Word буде помітно гіршим. Початковий .docx, якщо він десь ще є, завжди чистіший. Цей інструмент — для випадків, коли оригіналу немає.
- Якщо потрібен лише текст, а не Word-файл, див. pdf-to-txt. Швидше і дає чистий текст, який можна вставити будь-куди.
Що відбувається з файлом
Ваш PDF читається у пам'ять браузера, розбирається на текст і макет прямо там і локально перетворюється на .docx. Отриманий Word-файл пропонується для завантаження; нічого не вивантажується, жоден сервер ваш документ не обробляє. Перевірити можна: відкрийте DevTools, спостерігайте Network під час конвертації — побачите, що вихідних запитів зі вмістом файлу немає.
Часті запитання
Чи завантажується мій PDF на сервер?
Ні. Конвертація відбувається цілком у вашому браузері. Файл не покидає пристрій.
Чи зберігаються таблиці та форматування?
Так. Таблиці, списки, заголовки та більшість форматування абзаців переносяться у DOCX. Складна верстка може трохи зміститися.
Чи конвертуються скановані PDF (OCR)?
Сканованим PDF потрібен OCR, щоб стати редагованим текстом. Цифрові PDF (експорт з Word, InDesign тощо) конвертуються чисто.
Чи справляється зі складною версткою?
Колонки, виноски й текстові блоки апроксимуються. Для ідеального результату після конвертації завжди звіряйте DOCX із джерелом.