PDF σε κείμενο

Εξαγωγή κειμένου από οποιοδήποτε PDF,
στον περιηγητή σας.

Ανακτήστε καθαρή στρώση κειμένου από οποιοδήποτε PDF — οι παράγραφοι διατηρούνται, πολλές σελίδες, UTF-8. Η εξαγωγή εκτελείται μέσα στον περιηγητή σας, οπότε το αρχείο δεν φεύγει ποτέ από τη συσκευή σας.

Ρίξτε εδώ το PDF από το οποίο θέλετε να εξαγάγετε κείμενο
Διαβάζουμε την ενσωματωμένη στρώση κειμένου με pdf.js — χωρίς OCR, χωρίς διακομιστή.
Πολλές σελίδες · Έξοδος UTF-8 Σαρωμένα PDF χρειάζονται OCR — αυτό το εργαλείο διαβάζει μόνο τη στρώση κειμένου
Δωρεάν
Χωρίς εγγραφή
Χωρίς ανέβασμα
Έξοδος UTF-8
ΠΏΣ ΛΕΙΤΟΥΡΓΕΊ

Τρία βήματα. Το PDF σας δεν φεύγει ποτέ από αυτή την καρτέλα.

1

Ρίξτε το PDF σας

Διαλέξτε το αρχείο από το οποίο θέλετε να εξαγάγετε κείμενο. Φορτώνεται στη μνήμη του περιηγητή, όχι σε διακομιστή.

2

Διαβάζουμε τη στρώση κειμένου

Το pdf.js διατρέχει κάθε σελίδα, ταξινομεί τα στοιχεία κατά συντεταγμένη Y και αναπαράγει τα διαλείμματα παραγράφων όπου ανήκουν.

3

Αντιγραφή ή λήψη .txt

Πάρτε καθαρό κείμενο UTF-8. Αντιγράψτε στο πρόχειρο ή αποθηκεύστε ως .txt — εσείς αποφασίζετε.

FAQ

Συχνές ερωτήσεις

Πώς λειτουργεί η εξαγωγή;

Χρησιμοποιούμε το pdf.js της Mozilla για να διαβάσουμε την ενσωματωμένη στρώση κειμένου του PDF σας σελίδα-σελίδα. Τα στοιχεία ομαδοποιούνται κατά συντεταγμένη Y ώστε να διατηρηθούν τα διαλείμματα παραγράφων — χωρίς διακομιστή, χωρίς ανέβασμα.

Λειτουργεί σε σαρωμένα PDF;

Όχι. Οι σαρώσεις είναι εικόνες κειμένου, όχι κείμενο — η εξαγωγή τους απαιτεί OCR, το οποίο δεν εκτελεί αυτό το εργαλείο. Αν το PDF σας προέρχεται από σάρωση χαρτιού, χρειάζεστε πρώτα εργαλείο OCR.

Ανεβαίνει το αρχείο μου κάπου;

Ποτέ. Η εξαγωγή εκτελείται εξ ολοκλήρου στον περιηγητή σας μέσω WebAssembly — επαληθεύσιμο στα DevTools → Network. Το αρχείο μένει στη συσκευή σας.

Τι γίνεται με PDF προστατευμένα με κωδικό;

Ξεκλειδώστε το PDF πρώτα με το εργαλείο μας Ξεκλείδωμα PDF και μετά κάντε εξαγωγή. Οι κρυπτογραφημένες ροές περιεχομένου δεν αναλύονται χωρίς τον κωδικό.

Ποιο είναι το όριο μεγέθους αρχείου;

Έως 100 MB. Μεγαλύτερα μπορεί να εξαντλήσουν τη μνήμη του περιηγητή — δοκιμάστε να τα διαχωρίσετε πρώτα με το Διαχωρισμός PDF.