Udtræk tekst fra enhver PDF,
i din browser.
Træk et rent tekstlag ud af enhver PDF — afsnit bevaret, flere sider, UTF-8. Udtrækningen kører inde i din browser, så filen forlader aldrig din enhed.
Tre trin. Din PDF forlader aldrig denne fane.
Slip din PDF
Vælg den fil, du vil udtrække tekst fra. Den indlæses i browserens hukommelse, ikke på en server.
Vi læser tekstlaget
pdf.js gennemgår hver side, sorterer elementer efter Y-koordinat og genskaber afsnitsbrud, hvor de hører hjemme.
Kopiér eller download .txt
Få ren UTF-8-tekst. Kopiér til udklipsholder eller gem som .txt — du bestemmer.
Ofte stillede spørgsmål
Hvordan fungerer udtrækningen?
Vi bruger Mozillas pdf.js til at læse det indlejrede tekstlag i din PDF side for side. Elementer grupperes efter Y-koordinat, så afsnitsbrud overlever — ingen server, ingen upload.
Virker det på scannede PDF'er?
Nej. Scanninger er billeder af tekst, ikke tekst — udtrækning kræver OCR, som dette værktøj ikke kører. Hvis din PDF stammer fra scannet papir, har du brug for et OCR-værktøj først.
Bliver min fil uploadet et sted?
Aldrig. Udtrækningen kører helt i din browser via WebAssembly — kan verificeres i DevTools → Network. Filen forbliver på din enhed.
Hvad med adgangskodebeskyttede PDF'er?
Lås PDF'en op først med vores værktøj Lås PDF op, og udtræk derefter. Krypterede indholdsstrømme kan ikke parses uden adgangskoden.
Hvad er filstørrelsesgrænsen?
Op til 100 MB. Større filer kan tømme browserens hukommelse — prøv først at opdele dem med Opdel PDF.