Haal tekst uit elke PDF,
in je browser.
Trek een schone tekstlaag uit elke PDF — alinea's blijven behouden, meerdere pagina's, UTF-8. Extractie gebeurt in je browser, dus het bestand verlaat je apparaat nooit.
Drie stappen. Je PDF verlaat dit tabblad nooit.
Sleep je PDF
Kies het bestand waaruit je tekst wilt halen. Het wordt in het browsergeheugen geladen, niet op een server.
We lezen de tekstlaag
pdf.js doorloopt elke pagina, sorteert de items op Y-coördinaat en herstelt alinea-onderbrekingen op de juiste plek.
Kopieer of download .txt
Krijg schone UTF-8 platte tekst. Kopieer naar het klembord of bewaar als .txt — jij bepaalt.
Veelgestelde vragen
Hoe werkt de extractie?
We gebruiken Mozilla's pdf.js om de ingebedde tekstlaag van je PDF pagina voor pagina te lezen. Items worden op Y-coördinaat gegroepeerd zodat alinea-onderbrekingen behouden blijven — geen server, geen upload.
Werkt het op gescande PDF's?
Nee. Scans zijn afbeeldingen van tekst, geen tekst — extractie vereist OCR, dat deze tool niet uitvoert. Als je PDF van gescand papier komt, heb je eerst een OCR-tool nodig.
Wordt mijn bestand ergens geüpload?
Nooit. De extractie draait volledig in je browser via WebAssembly — verifieerbaar in DevTools → Netwerk. Het bestand blijft op je apparaat.
En PDF's met wachtwoord?
Ontgrendel de PDF eerst met onze tool PDF ontgrendelen en extraheer daarna. Versleutelde inhoudsstromen kunnen niet worden gelezen zonder het wachtwoord.
Wat is de bestandsgroottelimiet?
Tot 100 MB. Grotere bestanden kunnen het browsergeheugen uitputten — splits ze eerst met PDF splitsen.