Estrai il testo da qualsiasi PDF,
nel tuo browser.
Recupera un livello di testo pulito da qualsiasi PDF — paragrafi preservati, multipagina, UTF-8. L'estrazione avviene dentro il tuo browser, quindi il file non lascia mai il dispositivo.
Tre passaggi. Il tuo PDF non lascia mai questa scheda.
Trascina il tuo PDF
Scegli il file da cui estrarre il testo. Viene caricato nella memoria del browser, non su un server.
Leggiamo il livello di testo
pdf.js percorre ogni pagina, ordina gli elementi per coordinata Y e ricostruisce le interruzioni di paragrafo dove servono.
Copia o scarica .txt
Ottieni testo semplice UTF-8 pulito. Copialo negli appunti o salvalo come .txt — decidi tu.
Domande frequenti
Come funziona l'estrazione?
Usiamo pdf.js di Mozilla per leggere il livello di testo incorporato del PDF, pagina per pagina. Gli elementi vengono raggruppati per coordinata Y così le interruzioni di paragrafo restano intatte — niente server, niente upload.
Funziona sui PDF scansionati?
No. Le scansioni sono immagini di testo, non testo — la loro estrazione richiede OCR, che questo strumento non esegue. Se il tuo PDF deriva da carta scansionata, ti serve prima uno strumento OCR.
Il mio file viene caricato da qualche parte?
Mai. L'estrazione avviene interamente nel tuo browser tramite WebAssembly — verificabile in DevTools → Network. Il file resta sul tuo dispositivo.
E i PDF protetti da password?
Sblocca prima il PDF con il nostro strumento Sblocca PDF e poi estrai. I flussi di contenuto cifrati non possono essere analizzati senza la password.
Qual è il limite di dimensione?
Fino a 100 MB. Oltre, la memoria del browser potrebbe esaurirsi — prova prima a dividere il file con Dividi PDF.