PDF til tekst

Udtræk tekst fra enhver PDF,
i din browser.

Træk et rent tekstlag ud af enhver PDF — afsnit bevaret, flere sider, UTF-8. Udtrækningen kører inde i din browser, så filen forlader aldrig din enhed.

Slip den PDF, du vil udtrække tekst fra
Vi læser det indlejrede tekstlag med pdf.js — ingen OCR, ingen server.
Flere sider · UTF-8-output Scannede PDF'er kræver OCR — dette værktøj læser kun tekstlaget
Gratis
Ingen tilmelding
Ingen upload
UTF-8-output
SÅDAN VIRKER DET

Tre trin. Din PDF forlader aldrig denne fane.

1

Slip din PDF

Vælg den fil, du vil udtrække tekst fra. Den indlæses i browserens hukommelse, ikke på en server.

2

Vi læser tekstlaget

pdf.js gennemgår hver side, sorterer elementer efter Y-koordinat og genskaber afsnitsbrud, hvor de hører hjemme.

3

Kopiér eller download .txt

Få ren UTF-8-tekst. Kopiér til udklipsholder eller gem som .txt — du bestemmer.

FAQ

Ofte stillede spørgsmål

Hvordan fungerer udtrækningen?

Vi bruger Mozillas pdf.js til at læse det indlejrede tekstlag i din PDF side for side. Elementer grupperes efter Y-koordinat, så afsnitsbrud overlever — ingen server, ingen upload.

Virker det på scannede PDF'er?

Nej. Scanninger er billeder af tekst, ikke tekst — udtrækning kræver OCR, som dette værktøj ikke kører. Hvis din PDF stammer fra scannet papir, har du brug for et OCR-værktøj først.

Bliver min fil uploadet et sted?

Aldrig. Udtrækningen kører helt i din browser via WebAssembly — kan verificeres i DevTools → Network. Filen forbliver på din enhed.

Hvad med adgangskodebeskyttede PDF'er?

Lås PDF'en op først med vores værktøj Lås PDF op, og udtræk derefter. Krypterede indholdsstrømme kan ikke parses uden adgangskoden.

Hvad er filstørrelsesgrænsen?

Op til 100 MB. Større filer kan tømme browserens hukommelse — prøv først at opdele dem med Opdel PDF.