Συγκάλυψη PDF

Συγκάλυψη κειμένου σε PDF
στον περιηγητή σας.

Πληκτρολογήστε τις λέξεις προς συγκάλυψη — κάθε εμφάνιση σε κάθε σελίδα καλύπτεται. Χωρίς ανέβασμα, χωρίς διαρροή. (Οπτική συγκάλυψη, όχι ιατροδικαστικού επιπέδου — βλ. FAQ.)

Αφήστε ένα PDF για συγκάλυψη
Ανοίγουμε τον επεξεργαστή με ενεργό το παράθυρο συγκάλυψης.

Επαληθεύστε το μόνοι σας: ανοίξτε τα DevTools → καρτέλα Network → ρίξτε ένα αρχείο. Δείτε ότι δεν γίνεται καμία μεταφόρτωση.

Πληκτρολόγηση-αναζήτηση · Μαύρο κουτί Καλύψτε κάθε αντιστοιχία σε κάθε σελίδα
Δωρεάν
Χωρίς εγγραφή
Χωρίς ανέβασμα
Πληκτρολόγηση-αναζήτηση · Μαύρο κουτί
ΠΩΣ ΛΕΙΤΟΥΡΓΕΙ

Τρία βήματα. Το αρχείο σας δεν φεύγει ποτέ από αυτή την καρτέλα.

1

Αφήστε το PDF

Επιλέξτε το αρχείο για συγκάλυψη. Φορτώνεται στη μνήμη του περιηγητή, όχι σε διακομιστή.

2

Πληκτρολογήστε τα μοτίβα

Ονόματα, email, τηλέφωνα — ένα ανά γραμμή ή χωρισμένα με κόμμα. Βρίσκουμε κάθε αντιστοιχία.

3

Κατεβάστε το συγκαλυμμένο αντίγραφο

Κάθε αντιστοιχία καλύπτεται από αδιαφανές μαύρο ορθογώνιο σε κάθε σελίδα. Το πρωτότυπο μένει ανέπαφο.

Να καλύψετε κείμενο που δεν θέλετε να μοιραστείτε

Οι λόγοι να αναθεωρήσετε (redact) ένα PDF αφορούν συνήθως την απόκρυψη μερών ενός εγγράφου διατηρώντας το υπόλοιπο αναγνώσιμο. Συμβόλαιο με τη διεύθυνση κατοικίας αντισυμβαλλόμενου πάει σε τρίτο εξεταστή που δεν πρέπει να βλέπει αυτή τη διεύθυνση. Ιατρική παραπομπή μοιράζεται με ασφαλιστή όπου το αναγνωριστικό ασθενούς πρέπει να καλυφθεί. Οικονομική κατάσταση επισυνάπτεται σε φάκελο για συμβούλιο αλλά οι αριθμοί λογαριασμών σε επίπεδο μονάδας πρέπει να καλυφθούν. Πρόταση έργου παρουσιάζεται σε υποψήφιους προμηθευτές με τη γραμμή προϋπολογισμού μαυρισμένη ώστε να προτείνουν χωρίς να αγκυροβολούν στον αριθμό. Η εργασία εδώ είναι μικρή και προβλέψιμη: πληκτρολογείτε τις λέξεις ή φράσεις προς απόκρυψη και το εργαλείο σχεδιάζει ένα αδιαφανές μαύρο ορθογώνιο πάνω σε κάθε εμφάνιση σε κάθε σελίδα.

Διαβάστε αυτό προσεκτικά πριν αναθεωρήσετε οτιδήποτε ευαίσθητο: αυτή είναι οπτική αναθεώρηση, όχι εγκληματολογική. Τα μαύρα ορθογώνια καλύπτουν το κείμενο στην οθόνη και στην εκτύπωση, αλλά το υποκείμενο κείμενο παραμένει στο αρχείο. Όποιος έχει εργαλείο PDF μπορεί να το εξάγει μέσω αντιγραφής-επικόλλησης, αναζήτησης ή επιθεώρησης content-stream. Είναι κατάλληλο όταν περιστασιακοί αναγνώστες δεν πρέπει να δουν το κείμενο — αποστολή προσχεδίου, απόκρυψη μη δημόσιων αριθμών λογαριασμών από συνάδελφο, μάσκα του τηλεφώνου σας σε στιγμιότυπο. Δεν είναι κατάλληλο για δημοσιεύσεις βάσει νόμων διαφάνειας, δικαστικές καταθέσεις ή οτιδήποτε όπου ένας αντίπαλος θα κοιτάξει προσεκτικά.

Πώς λειτουργεί η αντιστοίχιση

Εισάγετε ένα ή περισσότερα μοτίβα. Κάθε μοτίβο αναζητείται ως αντιστοίχιση whole-substring χωρίς ευαισθησία πεζών-κεφαλαίων ενάντια σε τμήματα κειμένου εντός του PDF. Όταν ένα τμήμα περιέχει το μοτίβο σας, σχεδιάζεται μαύρο ορθογώνιο πάνω σε ολόκληρο το bounding-rect του τμήματος.

Πρακτικές συνέπειες:

  • Αντιστοίχιση υποσυμβολοσειράς, όχι ολόκληρης λέξης. Το μοτίβο art καλύπτει «art», «artist», «smart», «martin». Κάντε τα μοτίβα αρκετά συγκεκριμένα — πλήρη ονόματα, πλήρεις αριθμοί λογαριασμών, πλήρη e-mail.
  • Χωρίς ευαισθησία στα πεζά-κεφαλαία. Το μοτίβο Anna καλύπτει «Anna», «anna», «ANNA».
  • Χωρίς regex, χωρίς wildcards. Αυτό που πληκτρολογείτε είναι η κυριολεκτική ακολουθία προς αντιστοίχιση.
  • Κάλυψη ανά τμήμα. Το PDF αποθηκεύει κείμενο σε τμήματα· το σχεδιαζόμενο bounding rect καλύπτει ολόκληρο τμήμα. Αν το μοτίβο σας χτυπήσει μια λέξη σε τμήμα με περισσότερο κείμενο, καλύπτεται και το γύρω κείμενο. Συνήθως αυτό θέλετε· κάποιες φορές θα δείτε περισσότερα καλυμμένα από όσα περιμένατε.
  • Μοτίβα που διασταυρώνουν όρια τμημάτων χάνονται. Το «Γιάννης Παπαδόπουλος» είναι ένα τμήμα σε κάποια PDF και δύο σε άλλα. Αν διαχωριστεί, το μοτίβο δεν θα ταιριάξει στη συγκολλημένη συμβολοσειρά. Προσθέστε τα τμήματα ως ξεχωριστά μοτίβα: Γιάννης Παπαδόπουλος, Παπαδόπουλος, Γιάννης.

Το μαύρο ορθογώνιο έχει 1 σημείο padding γύρω από το εντοπισμένο bounding box — λόγω υποπίξελ τοποθέτησης γλυφών, ώστε να μην ξεπροβάλλουν λωρίδες του αρχικού κειμένου στις άκρες.

Τι κρύβεται vs. τι παραμένει στο αρχείο

Αυτή η ενότητα μετράει περισσότερο από οποιαδήποτε άλλη. Το μαύρο ορθογώνιο είναι μια οδηγία σχεδίασης στο content-stream της σελίδας. Το αρχικό κείμενο είναι επίσης στο content-stream, από κάτω. Οι αναγνώστες PDF τα εμφανίζουν με τη σειρά: πρώτα κείμενο, μετά ορθογώνιο από πάνω, οπότε το ορθογώνιο νικά οπτικά. Αλλά το ίδιο το κείμενο δεν διαγράφεται.

Τι σημαίνει αυτό συγκεκριμένα:

  • Η αντιγραφή-επικόλληση ανακτά το αρχικό κείμενο. Επιλέγοντας την αναθεωρημένη περιοχή σε Adobe Reader και αντιγράφοντας παίρνετε τις λέξεις που προσπαθήσατε να κρύψετε. Το μαύρο ορθογώνιο δεν επιλέγεται· το από κάτω κείμενο επιλέγεται.
  • Οι μηχανές αναζήτησης βρίσκουν το κείμενο. Αν το αναθεωρημένο PDF ανέβει σε ιστοσελίδα, αναζήτηση για το αναθεωρημένο όνομα θα φέρει το έγγραφο.
  • Επανα-αποθήκευση σε άλλο εργαλείο PDF μπορεί να κρατήσει και τα δύο επίπεδα. Κάποια εργαλεία αναδημιουργούν το content-stream και μπορεί να ρίξουν τις αναθεωρήσεις· άλλα τις κρατούν.
  • Εγκληματολογικά εργαλεία εξάγουν το αρχικό εύκολα. Οποιοσδήποτε PDF parser μπορεί να καταγράψει όλα τα content-streams κειμένου. Το ορθογώνιο είναι απλώς ένα ξεχωριστό σχέδιο.

Για περιπτώσεις όπου το υποκείμενο κείμενο πρέπει πραγματικά να φύγει — δημοσιεύσεις βάσει νόμων διαφάνειας, αποδείξεις σε δικαστήριο, οτιδήποτε φτάνει σε αντίπαλο — χρειάζεστε άλλο workflow: επανα-εξαγωγή του πηγαίου εγγράφου με το ευαίσθητο κείμενο διαγραμμένο, ή μετατροπή της σελίδας σε εικόνα και επανα-OCR (που αφαιρεί μόνιμα το επίπεδο κειμένου).

Τι επιβιώνει και τι όχι

  • Το ορατό περιεχόμενο σελίδων μένει το ίδιο. Όλα όσα δεν αντιστοιχήθηκαν μένουν ακριβώς όπως ήταν — ίδιες γραμματοσειρές, ίδια διάταξη, ίδιες εικόνες.
  • Σελιδοδείκτες, σχολιασμοί, σύνδεσμοι, πεδία φόρμας — όλα επιβιώνουν. Τα ορθογώνια είναι προσθετικές σχεδιάσεις· τίποτα άλλο δεν αναδημιουργείται.
  • Το αρχικό κείμενο διατηρείται από κάτω. Δείτε ενότητα παραπάνω. Είναι ο κεντρικός περιορισμός.
  • Οι ψηφιακές υπογραφές ακυρώνονται. Οποιαδήποτε τροποποίηση εγγράφου, συμπεριλαμβανομένης της προσθήκης ορθογωνίων, σπάει τη δέσμευση υπογραφής.
  • Τα κρυπτογραφημένα PDF πρέπει πρώτα να ξεκλειδωθούν. Περάστε μέσω unlock-pdf με τον κωδικό πριν την αναθεώρηση.

Αν κάτι μοιάζει στραβό

  • «At least one redaction pattern required». Η λίστα μοτίβων ήταν κενή. Πληκτρολογήστε τουλάχιστον μία λέξη ή φράση.
  • Το μοτίβο αντιστοιχήθηκε αλλά κάλυψε περισσότερο κείμενο από όσο περίμενα. Το PDF αποθήκευσε αυτή τη γραμμή ως ένα τμήμα και το ορθογώνιο είναι ανά τμήμα. Συνήθως αποδεκτό· αν είναι πρόβλημα, η πηγή πρέπει να επανα-εξαχθεί με σωστά αφαιρεμένο κείμενο.
  • Το μοτίβο δεν αντιστοιχήθηκε με αυτό που περίμενα. Τρεις συνηθισμένες αιτίες: (1) το κείμενο είναι σε σαρωμένη εικόνα, όχι σε επίπεδο κειμένου — το εργαλείο δεν βλέπει κείμενο σε εικόνα· πρώτα OCR μέσω pdf-to-txt ή ειδικού εργαλείου. (2) Το μοτίβο εκτείνεται σε τμήματα — σπάστε σε μικρότερα. (3) Το PDF χρησιμοποιεί μη λατινικούς χαρακτήρες με σπασμένη κωδικοποίηση· αντιγραφή από προβολέα για να δείτε τι πραγματικά είναι εκεί είναι η ταχύτερη διάγνωση.
  • Αναθεώρησα αλλά συνάδελφος εξήγαγε το κείμενο μέσω αντιγραφής-επικόλλησης. Λειτουργεί όπως τεκμηριώθηκε — μόνο οπτική αναθεώρηση. Για πραγματική αφαίρεση επανα-εξαγάγετε από την πηγή.

Πρακτικές σημειώσεις

  1. Χρησιμοποιήστε για οπτική απόκρυψη, όχι για εχθρικά σενάρια. Απόκρυψη ονόματος σε πρόχειρο που στέλνετε σε φίλο που δεν θα εξάγει: εντάξει. Απόκρυψη ονόματος σε δικαστική κατάθεση όπου η αντίπαλη πλευρά θα τρέξει εγκληματολογικά εργαλεία: όχι εντάξει.
  2. Συγκεκριμένα μοτίβα αντί γενικών. Αναθεωρήστε +30-21-0555-0123, όχι 0123. Αναθεωρήστε [email protected], όχι jane. Συγκεκριμένα μοτίβα υπερ-καλύπτουν λιγότερο και κρύβουν εξίσου αυτό που θέλατε.
  3. Επαληθεύστε με αντιγραφή. Μετά την αναθεώρηση ανοίξτε το αποτέλεσμα σε προβολέα, επιλέξτε την αναθεωρημένη περιοχή, αντιγράψτε. Αν βγει το αρχικό κείμενο, επιβεβαιώσατε τον περιορισμό — προχωρήστε μόνο αν η οπτική απόκρυψη επαρκεί.
  4. Για διαρκή αφαίρεση χρησιμοποιήστε την πηγή. Αν το έγγραφο προήλθε από Word, επεξεργαστείτε το Word και επανα-εξαγάγετε. Από βάση δεδομένων, ξανα-ρωτήστε χωρίς ευαίσθητα πεδία. Το εργαλείο αναθεώρησης PDF είναι για περιπτώσεις χωρίς πηγή.
  5. Το αρχικό αρχείο μένει άθικτο. Αυτό που κατεβάζετε είναι ένα νέο αναθεωρημένο PDF· η πηγή στον δίσκο δεν αλλάζει.

Τι συμβαίνει με το αρχείο σας

Η αναθεώρηση τρέχει στον φυλλομετρητή σας. Τα πληκτρολογημένα μοτίβα και το περιεχόμενο αρχείου δεν φεύγουν ποτέ από αυτή την καρτέλα. Ανοίξτε τα DevTools και παρακολουθήστε την καρτέλα Network κατά τη λειτουργία — κανένα εξερχόμενο αίτημα με περιεχόμενο αρχείου ή μοτίβα. Το PDF μένει στον δίσκο· η αναθεωρημένη έκδοση είναι μια νέα λήψη δίπλα.

FAQ

Συχνές ερωτήσεις

Θα συγκαλυφθούν όλες οι εμφανίσεις;

Ναι — σαρώνουμε κάθε σελίδα και καλύπτουμε κάθε αντιστοιχία κάθε μοτίβου που πληκτρολογήσατε. Δεν υπάρχει λειτουργία \"μόνο πρώτη εμφάνιση\"· η συγκάλυψη είναι σκόπιμα καθολική.

Είναι ιατροδικαστικού επιπέδου;

Όχι. Το MVP μας βάφει αδιαφανή ορθογώνια πάνω σε κάθε αντιστοιχία — οπτικά είναι συγκαλυμμένο, αλλά το υποκείμενο κείμενο παραμένει στο ρεύμα του PDF. Για ιατροδικαστική συγκάλυψη (πλήρης αφαίρεση κειμένου από το αρχείο) χρησιμοποιήστε εργαλείο desktop όπως το Adobe Acrobat Pro. Είμαστε διαφανείς για τον συμβιβασμό αυτόν.

Γιατί λοιπόν οπτική συγκάλυψη;

Για τις περισσότερες περιπτώσεις — κοινοποίηση δείγματος συμβολαίου, απόκρυψη τηλεφώνου σε screenshot, σβήσιμο ονομάτων σε portfolio — η οπτική συγκάλυψη αρκεί και είναι πολύ πιο γρήγορη από το να ανοίξετε Acrobat. Απλώς αποφύγετε για έγγραφα όπου ο αντίδικος θα κάνει εξαγωγή κειμένου.

Μπορώ να συγκαλύψω συγκεκριμένη περιοχή αντί για κείμενο;

Η συγκάλυψη με επιλογή περιοχής (σύρσιμο ορθογωνίου στη σελίδα) είναι στο roadmap. Η τρέχουσα έκδοση είναι πληκτρολόγηση-αναζήτηση, που είναι εξαιρετική για email, ονόματα, τηλέφωνα και κάθε μοτίβο βασισμένο σε συμβολοσειρά.

Πού πάει το αρχείο μου;

Πουθενά. Η συγκάλυψη γίνεται εξ ολοκλήρου σε αυτή την καρτέλα. Επαληθεύεται στο DevTools → Network: δεν γίνεται ανέβασμα.