PDF till text

Extrahera text från valfri PDF,
i din webbläsare.

Dra ut ett rent textlager från valfri PDF — stycken bevaras, flera sidor, UTF-8. Extraktionen körs i din webbläsare så filen lämnar aldrig din enhet.

Släpp PDF-en du vill extrahera text från
Vi läser det inbäddade textlagret med pdf.js — ingen OCR, ingen server.

Kontrollera själv: öppna DevTools → fliken Network → släpp en fil. Se hur noll uppladdningar sker.

Flera sidor · UTF-8 utdata Skannade PDF-filer behöver OCR — detta är endast textlager
Gratis
Utan konto
Utan uppladdning
UTF-8 utdata
SÅ HÄR FUNGERAR DET

Tre steg. Din PDF lämnar aldrig den här fliken.

1

Släpp PDF-en här

Välj filen du vill extrahera text från. Den läses in i webbläsarens minne, inte en server.

2

Vi läser textlagret

pdf.js går igenom varje sida, sorterar element efter Y-koordinat och rekonstruerar styckeavbrott där de hör hemma.

3

Kopiera eller ladda ner .txt

Få ren UTF-8 vanlig text. Kopiera till urklipp eller spara som .txt-fil — du bestämmer.

FAQ

Vanliga frågor

Hur fungerar extraktionen?

Vi använder Mozillas pdf.js för att läsa det inbäddade textlagret av din PDF sida för sida. Element grupperas efter Y-koordinat så styckeavbrott bevaras — ingen server, ingen uppladdning.

Fungerar det på skannade PDF-filer?

Nej. Skanningar är bilder av text, inte text — att extrahera dem kräver OCR, som detta verktyg inte kör. Om din PDF skapades genom att skanna papper behöver du ett OCR-verktyg först.

Laddas min fil upp någonstans?

Aldrig. Extraktionen körs helt i din webbläsare via WebAssembly — verifierbart i DevTools → Network. Filen stannar på din enhet.

Vad händer med lösenordsskyddade PDF-filer?

Lås först upp PDF-en med vårt Lås upp PDF-verktyg och extrahera sedan. Krypterade content streams kan inte tolkas utan lösenordet.

Vilken är filstorleksgränsen?

Upp till 100 MB. Större kan ta slut på webbläsarminne — försök att dela med Dela PDF-verktyget först.