PDF do Word
Online
Převeďte PDF na editovatelné dokumenty Word. Rozvržení a tabulky zachovány — dokument nikdy neopustí prohlížeč.
Ověřte si sami: otevřete DevTools → záložku Network → přetáhněte soubor. Sledujte, jak neproběhne žádné nahrání.
Tři kroky. Nulové nahrávání.
Přetáhněte PDF
Načtěte soubor do paměti prohlížeče.
Převeďte v prohlížeči
Text, tabulky a formátování se extrahují lokálně.
Stáhněte DOCX
Otevřete ve Wordu nebo libovolném editoru. Původní PDF zůstává nedotčené.
Kdy se vyplatí převést PDF do Wordu
Nejčastější důvod: musíte dokument upravit a máte jen PDF. Někdo poslal smlouvu, zprávu nebo služební sdělení, a místa, která je třeba změnit, jsou rozeseta po dokumentu — opravit překlep, aktualizovat data, vyměnit odstavec za opravený. V PDF editoru to jde, ale pokud je hodně textu k přepsání, otevřít soubor ve Wordu je rychlejší a pohodlnější.
Další časté důvody: vytáhnout odstavce a vložit je do jiného dokumentu; zkopírovat sekci do těla mailu; přeformátovat životopis, který přišel jako PDF, na jinou pozici; znovu použít kusy odborného článku. Kdykoli je třeba dostat text z PDF do něčeho, co se dá editovat, je tahle konverze ta správná.
Co tato konverze umí a co ne
Nástroj vytáhne text z vašeho PDF a poskládá z něj wordovský dokument. Co to v praxi znamená, závisí silně na tom, co je vlastně vaše PDF.
- PDF založená na textu se konvertují dobře. Pokud PDF vzniklo exportem z Wordu, přes «Uložit jako PDF» z jakékoli aplikace, nebo systémem, který ho vyrobil přímo (fakturační program, generátor reportů), text v PDF je opravdu text — a nástroj ho čte čistě. Výsledný Word má vybíratelné, editovatelné odstavce.
- Naskenovaná PDF se vrátí v podobě odstavců jen tehdy, pokud mají OCR vrstvu. Čistý sken bez OCR je jen obraz stránek — žádný text k vytažení. Pokud bylo PDF naskenované, ale s již provedeným OCR (mnoho moderních skenerů a cloudových služeb přidává OCR vrstvu automaticky), nástroj ji přečte a vyrobí text. Pokud je to surový sken bez OCR, vyjde prázdný nebo skoro prázdný Word. V takovém případě nejdřív proženete PDF přes OCR nástroj.
- Rekonstrukce sazby je dobrá pro souvislý text, horší pro složitější rozvržení. Nástroj rozeznává tělo textu a nadpisy podle velikostí písma a seskupuje text po řádcích. Pro běžný dokument — odstavce, nadpisy, seznamy, jednoduché tabulky — to funguje. Pro vícesloupcové layouty, poznámky pod čarou kolem obrázků, postranní rámečky se proudícím textem vychází text v zhruba správném pořadí, ale ne v původní sazbě.
- Obrázky se aktuálně do wordovského souboru nevytahují. Nástroj se soustředí na text. Pokud PDF obsahuje fotky, grafy nebo diagramy, které potřebujete i ve Wordu, musíte je extrahovat zvlášť (otevřete PDF, snímek obrazovky, vložit do Wordu), nebo použít jinou cestu konverze.
A formátování
Nástroj se snaží zachovat to, co se přenáší spolehlivě:
- Nadpisy oproti tělu textu jsou odvozovány z velikosti písma — text výrazně větší než tělo se ve Wordu označí jako nadpis.
- Konce odstavců se zjišťují z meziřádkového odstupu, takže odstavce ve Wordu odpovídají odstavcům v PDF.
- Velikosti písma jsou zhruba zachovány na úrovni úseku — text 14pt v PDF bude ve Wordu kolem 14pt.
Co je těžší a proč:
- Tučné a kurzíva vyžadují, aby PDF skutečně používalo tučný nebo kurzivový font (ne obyčejný, který renderer vykreslil trochu silnější). Mnoho PDF to kóduje správně; některá ne.
- Tabulky se složitě sloučenými buňkami nebo vnořené tabulky obvykle splošťují do lineárních odstavců. Jednoduché tabulky procházejí lépe než vymyšlené.
- Originální fonty se odkazují, kde je to možné, ale pokud je váš počítač nemá, Word je nahradí svými. Obsah je správný; vzhled se může lišit.
Praktické poznámky
- Pokud má PDF heslo, nejdřív ho odemkněte. Před konverzí ho proženete přes unlock-pdf — šifrovaná PDF se neotevřou pro vytažení textu.
- U dlouhých PDF trvá konverze déle. Dokument na 200 stran je třeba parsovat stránku po stránce, pogrupovat řádky do odstavců a sestavit .docx. Na běžném notebooku počítejte přibližně s minutou. Při prvním spuštění mějte trpělivost.
- Cyklus je ztrátový. Pokud vezmete Word, převedete ho do PDF (nástrojem, který sazbu vypálí jako obraz), a pak to PDF zpátky do Wordu — druhý Word bude zřetelně hrubší než ten první. Původní .docx, pokud ještě někde je, bude vždy čistší. Tento nástroj je pro případy, kdy original už nemáte.
- Pokud potřebujete jen text, ne Word, viz pdf-to-txt. Rychlejší a dává prostý text, který se dá vložit kamkoli.
Co se stane s vaším souborem
Vaše PDF se načte do paměti prohlížeče, parsuje se tam na text a sazbu a lokálně se převede na .docx. Výsledný wordovský soubor je vám nabídnut ke stažení; nic se nenahrává, žádný server váš dokument nezpracovává. Můžete to ověřit: otevřete DevTools, sledujte záložku Network během konverze — neuvidíte žádné odchozí požadavky s obsahem vašeho souboru.
Časté dotazy
Nahrává se moje PDF na server?
Ne. Převod probíhá zcela ve vašem prohlížeči. Soubor neopouští zařízení.
Zachovává tabulky a formátování?
Ano. Tabulky, seznamy, nadpisy a většina formátování odstavců se přenášejí do DOCX. Složitá rozvržení se mohou mírně posunout.
Převedou se skenovaná PDF (OCR)?
Skenovaná PDF potřebují OCR, aby se stala editovatelným textem. Digitálně vytvořená PDF (export z Wordu, InDesignu atd.) se převedou čistě.
Zvládá složitá rozvržení?
Sloupce, poznámky pod čarou a textové rámečky se aproximují. Pro přesný výsledek po převodu vždy porovnejte DOCX se zdrojem.