PDF în Text

Extrage text din orice PDF,
în browserul tău.

Extrage un strat de text curat din orice PDF — paragrafele păstrate, multi-pagină, UTF-8. Extragerea rulează în browser, deci fișierul nu părăsește niciodată dispozitivul.

Trage PDF-ul din care vrei să extragi textul
Citim stratul de text încorporat cu pdf.js — fără OCR, fără server.

Verifică tu însuți: deschide DevTools → fila Network → trage un fișier. Vei vedea zero încărcări.

Multi-pagină · Output UTF-8 PDF-urile scanate au nevoie de OCR — acesta este doar pentru stratul de text
Gratuit
Fără cont
Fără încărcare
Output UTF-8
CUM FUNCȚIONEAZĂ

Trei pași. PDF-ul tău nu părăsește niciodată această filă.

1

Trage PDF-ul

Alege fișierul din care vrei să extragi textul. Se încarcă în memoria browserului tău, nu pe un server.

2

Citim stratul de text

pdf.js parcurge fiecare pagină, sortează elementele după coordonata Y și reconstruiește pauzele de paragraf unde trebuie.

3

Copiază sau descarcă .txt

Primește text simplu UTF-8 curat. Copiază în clipboard sau salvează ca fișier .txt — alegerea ta.

FAQ

Întrebări frecvente

Cum funcționează extragerea?

Folosim pdf.js de la Mozilla pentru a citi stratul de text încorporat al PDF-ului tău, pagină cu pagină. Elementele sunt grupate după coordonata Y, astfel încât pauzele de paragraf rezistă — fără server, fără încărcare.

Funcționează pe PDF-uri scanate?

Nu. Scanările sunt imagini cu text, nu text — extragerea lor necesită OCR, pe care acest instrument nu îl rulează. Dacă PDF-ul tău provine din scanarea hârtiei, vei avea nevoie mai întâi de un instrument OCR.

Fișierul meu este încărcat undeva?

Niciodată. Extragerea rulează integral în browserul tău prin WebAssembly — verificabil în DevTools → Network. Fișierul rămâne pe dispozitivul tău.

Cum stau lucrurile cu PDF-urile protejate cu parolă?

Deblochează mai întâi PDF-ul folosind instrumentul nostru Deblocare PDF, apoi extrage. Content stream-urile criptate nu pot fi parsate fără parolă.

Care este limita de dimensiune?

Până la 100 MB. Mai mult ar putea epuiza memoria browserului — încearcă să-l împarți cu instrumentul Împărțire PDF mai întâi.