Extrage text din orice PDF,
în browserul tău.
Extrage un strat de text curat din orice PDF — paragrafele păstrate, multi-pagină, UTF-8. Extragerea rulează în browser, deci fișierul nu părăsește niciodată dispozitivul.
Verifică tu însuți: deschide DevTools → fila Network → trage un fișier. Vei vedea zero încărcări.
Trei pași. PDF-ul tău nu părăsește niciodată această filă.
Trage PDF-ul
Alege fișierul din care vrei să extragi textul. Se încarcă în memoria browserului tău, nu pe un server.
Citim stratul de text
pdf.js parcurge fiecare pagină, sortează elementele după coordonata Y și reconstruiește pauzele de paragraf unde trebuie.
Copiază sau descarcă .txt
Primește text simplu UTF-8 curat. Copiază în clipboard sau salvează ca fișier .txt — alegerea ta.
Întrebări frecvente
Cum funcționează extragerea?
Folosim pdf.js de la Mozilla pentru a citi stratul de text încorporat al PDF-ului tău, pagină cu pagină. Elementele sunt grupate după coordonata Y, astfel încât pauzele de paragraf rezistă — fără server, fără încărcare.
Funcționează pe PDF-uri scanate?
Nu. Scanările sunt imagini cu text, nu text — extragerea lor necesită OCR, pe care acest instrument nu îl rulează. Dacă PDF-ul tău provine din scanarea hârtiei, vei avea nevoie mai întâi de un instrument OCR.
Fișierul meu este încărcat undeva?
Niciodată. Extragerea rulează integral în browserul tău prin WebAssembly — verificabil în DevTools → Network. Fișierul rămâne pe dispozitivul tău.
Cum stau lucrurile cu PDF-urile protejate cu parolă?
Deblochează mai întâi PDF-ul folosind instrumentul nostru Deblocare PDF, apoi extrage. Content stream-urile criptate nu pot fi parsate fără parolă.
Care este limita de dimensiune?
Până la 100 MB. Mai mult ar putea epuiza memoria browserului — încearcă să-l împarți cu instrumentul Împărțire PDF mai întâi.