PDF szövegbe

Szöveg kinyerése bármely PDF-ből,
a böngészőben.

Tiszta szövegréteg kinyerése bármely PDF-ből — bekezdések megőrizve, többoldalas, UTF-8. A kinyerés a böngészőjén belül fut, így a fájl soha nem hagyja el az eszközét.

Húzza ide a PDF-et, amelyből szöveget szeretne kinyerni
Beolvassuk a beágyazott szövegréteget pdf.js-szel — nincs OCR, nincs szerver.

Győződjön meg róla: nyissa meg a DevTools → Network fület → dobjon be egy fájlt. Nézze, ahogy nulla feltöltés történik.

Többoldalas · UTF-8 kimenet A szkennelt PDF-eknek OCR szükséges — ez csak szövegréteg
Ingyenes
Regisztráció nélkül
Feltöltés nélkül
UTF-8 kimenet
HOGYAN MŰKÖDIK

Három lépés. A PDF-je soha nem hagyja el ezt a lapot.

1

Húzza ide a PDF-et

Válassza ki a fájlt, amelyből szöveget szeretne kinyerni. Betöltődik a böngésző memóriájába, nem szerverre.

2

Beolvassuk a szövegréteget

A pdf.js végigmegy minden oldalon, Y-koordináta szerint rendezi az elemeket, és újraépíti a bekezdéstöréseket ott, ahol kell.

3

Másolás vagy .txt letöltés

Kapjon tiszta UTF-8 sima szöveget. Másolja a vágólapra, vagy mentse el .txt fájlként — Önön múlik.

GYIK

Gyakori kérdések

Hogyan működik a kinyerés?

A Mozilla pdf.js-ét használjuk a PDF beágyazott szövegrétegének olvasására oldalanként. Az elemek Y-koordinátájuk szerint csoportosítódnak, így a bekezdéstörések megmaradnak — nincs szerver, nincs feltöltés.

Működik szkennelt PDF-eken?

Nem. A szkennelések szöveg képei, nem szöveg — kinyerésükhöz OCR szükséges, amit ez az eszköz nem futtat. Ha a PDF-jét papír szkennelésével készítették, először OCR-eszközre lesz szüksége.

Feltöltődik a fájlom valahova?

Soha. A kinyerés teljes egészében a böngészőjében fut WebAssembly-vel — ellenőrizhető a DevTools → Network ablakban. A fájl az eszközén marad.

Mi a helyzet a jelszóval védett PDF-ekkel?

Először oldja fel a PDF-et a PDF Feloldása eszközünkkel, majd nyerjen ki. A titkosított tartalomstreamek nem elemezhetők jelszó nélkül.

Mi a fájlméret-korlát?

Akár 100 MB. Ennél nagyobbat a böngésző memóriája kimeríthet — próbálja meg először szétválasztani a PDF Szétválasztása eszközzel.