Εξαγωγή κειμένου από οποιοδήποτε PDF,
στον περιηγητή σας.
Ανακτήστε καθαρή στρώση κειμένου από οποιοδήποτε PDF — οι παράγραφοι διατηρούνται, πολλές σελίδες, UTF-8. Η εξαγωγή εκτελείται μέσα στον περιηγητή σας, οπότε το αρχείο δεν φεύγει ποτέ από τη συσκευή σας.
Τρία βήματα. Το PDF σας δεν φεύγει ποτέ από αυτή την καρτέλα.
Ρίξτε το PDF σας
Διαλέξτε το αρχείο από το οποίο θέλετε να εξαγάγετε κείμενο. Φορτώνεται στη μνήμη του περιηγητή, όχι σε διακομιστή.
Διαβάζουμε τη στρώση κειμένου
Το pdf.js διατρέχει κάθε σελίδα, ταξινομεί τα στοιχεία κατά συντεταγμένη Y και αναπαράγει τα διαλείμματα παραγράφων όπου ανήκουν.
Αντιγραφή ή λήψη .txt
Πάρτε καθαρό κείμενο UTF-8. Αντιγράψτε στο πρόχειρο ή αποθηκεύστε ως .txt — εσείς αποφασίζετε.
Συχνές ερωτήσεις
Πώς λειτουργεί η εξαγωγή;
Χρησιμοποιούμε το pdf.js της Mozilla για να διαβάσουμε την ενσωματωμένη στρώση κειμένου του PDF σας σελίδα-σελίδα. Τα στοιχεία ομαδοποιούνται κατά συντεταγμένη Y ώστε να διατηρηθούν τα διαλείμματα παραγράφων — χωρίς διακομιστή, χωρίς ανέβασμα.
Λειτουργεί σε σαρωμένα PDF;
Όχι. Οι σαρώσεις είναι εικόνες κειμένου, όχι κείμενο — η εξαγωγή τους απαιτεί OCR, το οποίο δεν εκτελεί αυτό το εργαλείο. Αν το PDF σας προέρχεται από σάρωση χαρτιού, χρειάζεστε πρώτα εργαλείο OCR.
Ανεβαίνει το αρχείο μου κάπου;
Ποτέ. Η εξαγωγή εκτελείται εξ ολοκλήρου στον περιηγητή σας μέσω WebAssembly — επαληθεύσιμο στα DevTools → Network. Το αρχείο μένει στη συσκευή σας.
Τι γίνεται με PDF προστατευμένα με κωδικό;
Ξεκλειδώστε το PDF πρώτα με το εργαλείο μας Ξεκλείδωμα PDF και μετά κάντε εξαγωγή. Οι κρυπτογραφημένες ροές περιεχομένου δεν αναλύονται χωρίς τον κωδικό.
Ποιο είναι το όριο μεγέθους αρχείου;
Έως 100 MB. Μεγαλύτερα μπορεί να εξαντλήσουν τη μνήμη του περιηγητή — δοκιμάστε να τα διαχωρίσετε πρώτα με το Διαχωρισμός PDF.