PDF naar tekst

Haal tekst uit elke PDF,
in je browser.

Trek een schone tekstlaag uit elke PDF — alinea's blijven behouden, meerdere pagina's, UTF-8. Extractie gebeurt in je browser, dus het bestand verlaat je apparaat nooit.

Sleep de PDF waaruit je tekst wilt halen
We lezen de ingebedde tekstlaag met pdf.js — geen OCR, geen server.
Multi-page · UTF-8-uitvoer Gescande PDF's vereisen OCR — deze tool leest alleen de tekstlaag
Gratis
Geen registratie
Geen upload
UTF-8-uitvoer
ZO WERKT HET

Drie stappen. Je PDF verlaat dit tabblad nooit.

1

Sleep je PDF

Kies het bestand waaruit je tekst wilt halen. Het wordt in het browsergeheugen geladen, niet op een server.

2

We lezen de tekstlaag

pdf.js doorloopt elke pagina, sorteert de items op Y-coördinaat en herstelt alinea-onderbrekingen op de juiste plek.

3

Kopieer of download .txt

Krijg schone UTF-8 platte tekst. Kopieer naar het klembord of bewaar als .txt — jij bepaalt.

FAQ

Veelgestelde vragen

Hoe werkt de extractie?

We gebruiken Mozilla's pdf.js om de ingebedde tekstlaag van je PDF pagina voor pagina te lezen. Items worden op Y-coördinaat gegroepeerd zodat alinea-onderbrekingen behouden blijven — geen server, geen upload.

Werkt het op gescande PDF's?

Nee. Scans zijn afbeeldingen van tekst, geen tekst — extractie vereist OCR, dat deze tool niet uitvoert. Als je PDF van gescand papier komt, heb je eerst een OCR-tool nodig.

Wordt mijn bestand ergens geüpload?

Nooit. De extractie draait volledig in je browser via WebAssembly — verifieerbaar in DevTools → Netwerk. Het bestand blijft op je apparaat.

En PDF's met wachtwoord?

Ontgrendel de PDF eerst met onze tool PDF ontgrendelen en extraheer daarna. Versleutelde inhoudsstromen kunnen niet worden gelezen zonder het wachtwoord.

Wat is de bestandsgroottelimiet?

Tot 100 MB. Grotere bestanden kunnen het browsergeheugen uitputten — splits ze eerst met PDF splitsen.