PDF do textu

Získejte text z libovolného PDF,
ve svém prohlížeči.

Vytáhněte čistou textovou vrstvu z jakéhokoli PDF — odstavce zachovány, více stránek, UTF-8. Extrakce běží uvnitř vašeho prohlížeče, takže soubor neopustí vaše zařízení.

Přetáhněte PDF, ze kterého chcete získat text
Vloženou textovou vrstvu čteme pomocí pdf.js — žádné OCR, žádný server.
Více stránek · Výstup UTF-8 Skenovaná PDF potřebují OCR — tento nástroj čte jen textovou vrstvu
Zdarma
Bez registrace
Bez nahrávání
Výstup UTF-8
JAK TO FUNGUJE

Tři kroky. Vaše PDF nikdy neopustí tuto kartu.

1

Přetáhněte PDF

Vyberte soubor, ze kterého chcete získat text. Načte se do paměti prohlížeče, ne na server.

2

Načteme textovou vrstvu

pdf.js prochází každou stránku, řadí položky podle souřadnice Y a obnovuje přerušení odstavců tam, kam patří.

3

Zkopírujte nebo stáhněte .txt

Získejte čistý text v UTF-8. Zkopírujte do schránky nebo uložte jako .txt — záleží na vás.

FAQ

Časté dotazy

Jak extrakce funguje?

Používáme pdf.js od Mozilly k načtení vložené textové vrstvy vašeho PDF stránku po stránce. Položky se seskupí podle souřadnice Y, aby přerušení odstavců zůstalo zachované — bez serveru, bez nahrávání.

Funguje to na skenovaných PDF?

Ne. Skeny jsou obrázky textu, nikoli text — k jejich extrakci je třeba OCR, které tento nástroj nespouští. Pokud váš PDF vznikl skenováním papíru, potřebujete nejdříve nástroj OCR.

Posílá se můj soubor někam?

Nikdy. Extrakce běží zcela ve vašem prohlížeči přes WebAssembly — ověřitelné v DevTools → Network. Soubor zůstává ve vašem zařízení.

Co PDF chráněná heslem?

Nejdříve PDF odemkněte naším nástrojem Odemknout PDF, pak extrahujte. Šifrované obsahové proudy nelze bez hesla rozluštit.

Jaký je limit velikosti souboru?

Až 100 MB. Větší soubory mohou vyčerpat paměť prohlížeče — zkuste je nejprve rozdělit nástrojem Rozdělit PDF.