PDF do Word
online
Konwertuj PDF na edytowalne dokumenty Word. Układ i tabele zachowane — dokument nigdy nie opuszcza przeglądarki.
Sprawdź sam: otwórz DevTools → zakładkę Network → upuść plik. Zobacz, że nie ma żadnych przesłań.
Trzy kroki. Zero przesyłania.
Upuść PDF
Plik zostaje wczytany do pamięci przeglądarki.
Konwertuj w przeglądarce
Tekst, tabele i formatowanie są wyodrębniane lokalnie.
Pobierz DOCX
Otwórz w Wordzie lub dowolnym edytorze. Oryginalny PDF pozostaje nietknięty.
Kiedy warto przekonwertować PDF na Word
Najczęstszy powód: trzeba poprawić dokument, a masz tylko PDF. Ktoś przesłał umowę, raport lub notatkę służbową, a miejsca do zmiany są rozsiane po całym dokumencie — poprawić literówkę, zaktualizować daty, podmienić akapit na poprawiony. Da się to zrobić w edytorze PDF, ale jeśli jest dużo tekstu do przeredagowania, otwarcie pliku w Wordzie jest szybsze i wygodniejsze.
Inne częste powody: wyciągnięcie akapitów do wklejenia w innym dokumencie; skopiowanie sekcji do treści maila; przeformatowanie CV, które przyszło w PDF, pod inne ogłoszenie; ponowne wykorzystanie fragmentów artykułu. Wszędzie tam, gdzie trzeba wydobyć tekst z PDF i włożyć go w coś edytowalnego, to ta konwersja jest właściwa.
Co ta konwersja może odzyskać, a czego nie
Narzędzie wyciąga tekst z PDF i odbudowuje dokument Word. Co to oznacza w praktyce, zależy mocno od tego, czym jest twój PDF.
- PDFy oparte na tekście konwertują się dobrze. Jeśli PDF powstał przez eksport z Worda, przez «Zapisz jako PDF» z dowolnej aplikacji, albo przez system, który wygenerował go bezpośrednio (program do faktur, generator raportów), tekst w PDF jest naprawdę tekstem — i narzędzie czyta go czysto. Wynikowy Word ma akapity, które można zaznaczyć i edytować.
- Skanowane PDFy wracają w postaci akapitów tylko jeśli mają warstwę OCR. Czysty skan bez OCR to tylko obraz stron — nie ma tekstu do wyciągnięcia. Jeśli PDF był skanowany, ale już z naniesionym OCR (wiele nowoczesnych skanerów i usług w chmurze dodaje warstwę automatycznie), narzędzie ją odczyta i wytworzy tekst. Jeśli to surowy skan bez OCR, dostaniesz pusty albo prawie pusty Word. W takim wypadku najpierw przepuść PDF przez narzędzie OCR.
- Odtworzenie układu jest dobre dla prozy, gorsze dla skomplikowanych łamań. Narzędzie rozpoznaje tekst główny i nagłówki, analizując rozmiary czcionek i grupując tekst po liniach. Dla zwykłego dokumentu — akapity, nagłówki, listy, proste tabele — działa to dobrze. Dla układów wielokolumnowych, przypisów oblepiających obrazy, ramek z tekstem, wynik ma tekst w mniej więcej dobrej kolejności, ale nie w oryginalnym układzie.
- Obrazy nie są obecnie wydobywane do pliku Word. Narzędzie skupia się na tekście. Jeśli PDF zawiera zdjęcia, wykresy lub diagramy, które potrzebne ci są też w Wordzie, musisz wyciągnąć je osobno (otwórz PDF, zrób zrzut, wklej w Wordzie) albo skorzystać z innej ścieżki konwersji.
A formatowanie
Narzędzie próbuje zachować to, co przenosi się rzetelnie:
- Nagłówki kontra tekst główny są wyłapywane na podstawie rozmiaru czcionki — tekst wyraźnie większy od głównego oznaczany jest w Wordzie jako nagłówek.
- Podziały akapitów wykrywa się po odstępach między liniami, więc akapity w Wordzie odpowiadają akapitom w PDF.
- Rozmiary czcionek są zachowywane mniej więcej na poziomie fragmentów — 14pt w PDF będzie około 14pt w Wordzie.
Co jest trudniejsze, i dlaczego:
- Pogrubienie i kursywa wymagają, by PDF rzeczywiście używał czcionki pogrubionej lub kursywnej (nie zwykłej, którą silnik renderujący narysował nieco grubiej). Wiele PDFów koduje to poprawnie; niektóre nie.
- Tabele ze złożonym łączeniem komórek lub tabele zagnieżdżone zwykle spłaszczają się do liniowych akapitów. Proste tabele przechodzą lepiej niż wymyślne.
- Oryginalne czcionki są wskazywane, kiedy to możliwe, ale jeśli twój komputer ich nie ma, Word podstawi własne. Treść jest poprawna; wygląd może się różnić.
Uwagi praktyczne
- Jeśli PDF ma hasło, najpierw odblokuj. Przepuść plik przez unlock-pdf przed konwersją — zaszyfrowane PDF-y nie otwierają się do wyciągnięcia tekstu.
- Przy długich PDF konwersja zajmuje czas. Dokument na 200 stron trzeba przeparsować strona po stronie, pogrupować linie w akapity i zbudować .docx. Na typowym laptopie licz na około minutę. Bądź cierpliwy przy pierwszym uruchomieniu.
- Cykl jest stratny. Jeśli weźmiesz Worda, zamienisz na PDF (narzędziem, które utrwala układ jako obraz), a potem ten PDF z powrotem na Word — drugi Word będzie znacznie surowszy od pierwszego. Oryginalny .docx, jeśli jeszcze gdzieś jest, zawsze będzie czystszy. To narzędzie jest do przypadków, w których oryginał już nie jest dostępny.
- Jeśli potrzebujesz tylko tekstu, a nie pliku Word, zobacz pdf-to-txt. Szybciej i daje czysty tekst do wklejenia gdziekolwiek.
Co dzieje się z twoim plikiem
PDF wczytuje się do pamięci przeglądarki, tam jest parsowany pod kątem tekstu i układu, i konwertowany do .docx lokalnie. Powstały Word jest oferowany do pobrania; nic nie jest wysyłane, żaden serwer nie przetwarza twojego dokumentu. Możesz to sprawdzić: otwórz DevTools, obserwuj kartę Network podczas konwersji — nie zobaczysz żadnych żądań wychodzących z zawartością twojego pliku.
Najczęstsze pytania
Czy mój PDF jest przesyłany na serwer?
Nie. Konwersja odbywa się w całości w Twojej przeglądarce. Plik nie opuszcza urządzenia.
Czy tabele i formatowanie są zachowane?
Tak. Tabele, listy, nagłówki i większość formatowania akapitów trafia do DOCX. Złożone układy mogą się lekko przesunąć.
Czy zeskanowane PDF-y się przekonwertują (OCR)?
Zeskanowane PDF-y wymagają OCR, by stać się edytowalnym tekstem. PDF-y natywne (eksport z Worda, InDesigna itp.) konwertują się czysto.
Czy radzi sobie ze złożonymi układami?
Kolumny, przypisy i pola tekstowe są aproksymowane. Dla idealnego efektu zawsze porównaj DOCX ze źródłem po konwersji.