Získejte text z libovolného PDF,
ve svém prohlížeči.
Vytáhněte čistou textovou vrstvu z jakéhokoli PDF — odstavce zachovány, více stránek, UTF-8. Extrakce běží uvnitř vašeho prohlížeče, takže soubor neopustí vaše zařízení.
Tři kroky. Vaše PDF nikdy neopustí tuto kartu.
Přetáhněte PDF
Vyberte soubor, ze kterého chcete získat text. Načte se do paměti prohlížeče, ne na server.
Načteme textovou vrstvu
pdf.js prochází každou stránku, řadí položky podle souřadnice Y a obnovuje přerušení odstavců tam, kam patří.
Zkopírujte nebo stáhněte .txt
Získejte čistý text v UTF-8. Zkopírujte do schránky nebo uložte jako .txt — záleží na vás.
Časté dotazy
Jak extrakce funguje?
Používáme pdf.js od Mozilly k načtení vložené textové vrstvy vašeho PDF stránku po stránce. Položky se seskupí podle souřadnice Y, aby přerušení odstavců zůstalo zachované — bez serveru, bez nahrávání.
Funguje to na skenovaných PDF?
Ne. Skeny jsou obrázky textu, nikoli text — k jejich extrakci je třeba OCR, které tento nástroj nespouští. Pokud váš PDF vznikl skenováním papíru, potřebujete nejdříve nástroj OCR.
Posílá se můj soubor někam?
Nikdy. Extrakce běží zcela ve vašem prohlížeči přes WebAssembly — ověřitelné v DevTools → Network. Soubor zůstává ve vašem zařízení.
Co PDF chráněná heslem?
Nejdříve PDF odemkněte naším nástrojem Odemknout PDF, pak extrahujte. Šifrované obsahové proudy nelze bez hesla rozluštit.
Jaký je limit velikosti souboru?
Až 100 MB. Větší soubory mohou vyčerpat paměť prohlížeče — zkuste je nejprve rozdělit nástrojem Rozdělit PDF.