Redaguj tekst w PDF
w przeglądarce.
Wpisz słowa do zaczernienia — każde wystąpienie na każdej stronie zostaje zakryte. Bez wysyłania, bez wycieku. (Redakcja wizualna, nie poziomu kryminalistycznego — patrz FAQ.)
Sprawdź sam: otwórz DevTools → zakładkę Network → upuść plik. Zobacz, że nie ma żadnych przesłań.
Trzy kroki. Twój plik nigdy nie opuszcza tej karty.
Upuść PDF
Wybierz plik do zredagowania. Wczyta się do pamięci przeglądarki, nie na serwer.
Wpisz wzorce
Nazwiska, e-maile, telefony — po jednym w wierszu lub oddzielone przecinkami. Znajdziemy każde dopasowanie.
Pobierz zredagowaną kopię
Każde dopasowanie zostaje zakryte nieprzezroczystym czarnym prostokątem na każdej stronie. Oryginał pozostaje nietknięty.
Zakryć tekst, którego nie chcesz udostępnić
Powody zaczerniania (redact) PDF zwykle dotyczą ukrycia części dokumentu, pozostawiając resztę czytelną. Umowa z adresem domowym kontrahenta idzie do trzeciego recenzenta, który nie powinien zobaczyć tego adresu. Skierowanie medyczne dzielone jest z ubezpieczycielem, gdzie identyfikator pacjenta ma zostać zakryty. Sprawozdanie finansowe załączane jest do pakietu dla zarządu, ale numery rachunków na poziomie jednostki muszą być zakryte. Propozycja projektowa pokazywana jest kandydującym dostawcom z zaczernioną pozycją budżetową, by składali oferty bez zakotwiczania na liczbie. Zadanie tutaj jest małe i przewidywalne: wpisujesz słowa lub frazy do ukrycia, a narzędzie rysuje nieprzezroczysty czarny prostokąt nad każdym wystąpieniem na każdej stronie.
Przeczytaj uważnie przed zaczernieniem czegokolwiek wrażliwego: to jest zaczernianie wizualne, nie kryminalistyczne. Czarne prostokąty zakrywają tekst na ekranie i przy druku, ale tekst u spodu pozostaje w pliku. Każdy z narzędziem PDF wyciągnie go przez kopiuj-wklej, wyszukiwanie lub inspekcję content-stream. Jest to odpowiednie, gdy zwykli czytelnicy nie powinni widzieć tekstu — wysłanie szkicu, ukrycie niepublicznych numerów rachunków przed kolegą, maskowanie numeru telefonu na zrzucie ekranu. Nie jest odpowiednie dla publikacji w trybie dostępu do informacji publicznej, pism procesowych ani niczego, gdzie przeciwnik patrzy uważnie.
Jak działa dopasowanie
Wpisujesz jeden lub więcej wzorców. Każdy wzorzec wyszukiwany jest jako dopasowanie whole-substring nieczułe na wielkość liter wobec fragmentów tekstu wewnątrz PDF. Gdy fragment zawiera Twój wzorzec, nad całym bounding-rect fragmentu rysowany jest czarny prostokąt.
Praktyczne konsekwencje:
- Dopasowanie po podciągu, nie po całym słowie. Wzorzec
artzakryje «art», «artist», «smart», «martin». Rób wzorce dostatecznie specyficzne — pełne nazwiska, pełne numery rachunków, pełne adresy e-mail. - Nieczułe na wielkość liter. Wzorzec
Annazakryje «Anna», «anna», «ANNA». - Bez regex, bez gwiazdek. To, co wpiszesz, jest dosłowną sekwencją do dopasowania.
- Pokrycie pofragmentowe. PDF przechowuje tekst we fragmentach; rysowany bounding rect zakrywa cały fragment. Jeśli wzorzec trafia w słowo we fragmencie zawierającym więcej tekstu, otaczający tekst też zostanie zakryty. Zwykle to, czego chcesz; czasem zobaczysz więcej zakrytego niż się spodziewałeś.
- Wzorce przekraczające granice fragmentów są pomijane. «Jan Kowalski» to jeden fragment w niektórych PDF, dwa w innych. Jeśli rozdzielony, wzorzec nie dopasuje się do scalonego ciągu. Dodaj części jako osobne wzorce:
Jan Kowalski,Kowalski,Jan.
Czarny prostokąt ma 1 punkt wyściełania wokół wykrytego bounding boxa — z powodu subpikselowego rozmieszczenia glifów, by paski oryginalnego tekstu nie wystawały po brzegach.
Co jest zakryte vs. co nadal jest w pliku
Ta sekcja liczy się bardziej niż jakakolwiek inna. Czarny prostokąt to instrukcja rysowania w content-stream strony. Oryginalny tekst też jest w content-stream, pod nim. Czytniki PDF wyświetlają je w kolejności: najpierw tekst, potem prostokąt na wierzchu, więc prostokąt wygrywa wizualnie. Ale sam tekst nie jest usuwany.
Co to znaczy konkretnie:
- Kopiuj-wklej zwraca oryginalny tekst. Zaznaczenie zaczernionego obszaru w Adobe Reader i skopiowanie daje słowa, które chciałeś ukryć. Czarny prostokąt nie jest zaznaczalny; tekst pod nim — tak.
- Wyszukiwarki znajdą tekst. Jeśli zaczerniony PDF wgrany na stronę, wyszukiwanie po zaczernionym imieniu wyciągnie dokument.
- Ponowne zapisanie w innym narzędziu PDF może zachować obie warstwy. Niektóre narzędzia odbudowują content-stream i mogą porzucić zaczernienia; inne zachowują.
- Narzędzia kryminalistyczne wyciągają oryginał łatwo. Każdy parser PDF wymieni wszystkie content-streams tekstu. Prostokąt to po prostu osobny rysunek.
Dla sytuacji, w których tekst u spodu naprawdę musi zniknąć — publikacje w trybie jawności, dowody w sądzie, wszystko, co idzie do przeciwnika — potrzebujesz innego workflow: ponownie wyeksportuj dokument źródłowy z usuniętym wrażliwym tekstem, lub przekształć stronę w obraz i ponownie OCR (co trwale usuwa warstwę tekstową).
Co przetrwa, a co nie
- Widoczna zawartość stron pozostaje taka sama. Wszystko, co się nie dopasowało, zostaje dokładnie jak było — te same fonty, ten sam układ, te same obrazy.
- Zakładki, adnotacje, linki, pola formularzy — wszystko przetrwa. Prostokąty to dorysowane dodatki; nic innego nie jest odbudowywane.
- Oryginalny tekst zostaje zachowany pod spodem. Zobacz sekcję wyżej. To centralne ograniczenie.
- Podpisy cyfrowe tracą ważność. Każda modyfikacja dokumentu, w tym dodawanie prostokątów, zrywa powiązanie podpisu.
- Zaszyfrowane PDF muszą najpierw zostać odblokowane. Przepuść przez unlock-pdf z hasłem przed zaczernieniem.
Jeśli coś wygląda nie tak
- «At least one redaction pattern required». Lista wzorców była pusta. Wpisz przynajmniej jedno słowo lub frazę.
- Wzorzec dopasował się, ale zakrył więcej tekstu niż oczekiwałem. PDF zachował tę linię jako jeden fragment, a prostokąt jest pofragmentowy. Zwykle akceptowalne; jeśli to problem, źródło trzeba ponownie wyeksportować z poprawnie usuniętym tekstem.
- Wzorzec nie dopasował się do tego, czego oczekiwałem. Trzy zwykłe przyczyny: (1) tekst jest w skanowanym obrazie, nie w warstwie tekstowej — narzędzie nie widzi tekstu w obrazie; najpierw OCR przez pdf-to-txt lub dedykowane narzędzie. (2) Wzorzec rozciąga się przez fragmenty — podziel na krótsze. (3) PDF używa znaków niełacińskich z popsutym kodowaniem; kopiowanie z przeglądarki, by zobaczyć, co tam naprawdę jest, to najszybsza diagnoza.
- Zaczerniłem, ale kolega wyciągnął tekst przez kopiuj-wklej. Działa zgodnie z dokumentacją — tylko zaczernienie wizualne. Dla rzeczywistego usunięcia ponownie wyeksportuj ze źródła.
Notatki praktyczne
- Używaj do wizualnego ukrywania, nie do scenariuszy z przeciwnikiem. Ukrycie nazwiska w szkicu wysłanym do znajomego, który nie będzie wyciągał: ok. Ukrycie nazwiska w piśmie procesowym, gdzie strona przeciwna uruchomi narzędzia kryminalistyczne: nie ok.
- Wzorce specyficzne nad generycznymi. Zaczerniaj
+48-22-555-0123, nie0123. Zaczerniaj[email protected], niejane. Wzorce specyficzne mniej nadpokrywają i równie dobrze ukrywają to, co chciałeś. - Sprawdzaj kopiowaniem. Po zaczernieniu otwórz wynik w przeglądarce, zaznacz zaczerniony obszar, skopiuj. Jeśli wyjdzie oryginalny tekst, potwierdziłeś ograniczenie — kontynuuj tylko jeśli ukrycie wizualne wystarczy.
- Dla trwałego usunięcia użyj źródła. Jeśli dokument pochodzi z Worda, edytuj Worda i ponownie wyeksportuj. Z bazy — odpytaj ponownie bez wrażliwych pól. Narzędzie zaczerniania PDF służy do przypadków, gdy źródła nie ma.
- Plik źródłowy pozostaje nietknięty. Pobierany jest nowy zaczerniony PDF; źródło na dysku się nie zmienia.
Co dzieje się z twoim plikiem
Zaczernianie działa w twojej przeglądarce. Wpisane wzorce i zawartość pliku nigdy nie opuszczają tej karty. Otwórz DevTools i obserwuj zakładkę Network podczas operacji — żadnych żądań wychodzących z zawartością pliku ani wzorcami. PDF zostaje na dysku; wersja zaczerniona to nowe pobranie obok.
Najczęstsze pytania
Czy każde wystąpienie zostanie zredagowane?
Tak — przeglądamy każdą stronę i zakrywamy każde dopasowanie każdego wpisanego wzorca. Nie ma trybu „tylko pierwsze wystąpienie"; redakcja jest globalna z założenia.
Czy to redakcja kryminalistyczna?
Nie. Nasze MVP maluje nieprzezroczyste prostokąty na każdym dopasowaniu — wizualnie zredagowane, ale tekst pierwotny pozostaje w strumieniu PDF. Do redakcji kryminalistycznej (tekst usunięty z pliku, nie tylko ukryty) użyj narzędzia desktopowego, np. Adobe Acrobat Pro. Mówimy o tym kompromisie wprost.
Po co więc redakcja wizualna?
W większości przypadków — dzielenie się przykładową umową, zakrycie numeru w screenie, wymazanie nazwisk w portfolio — wystarcza i jest dużo szybsza niż uruchamianie Acrobata. Po prostu nie używaj jej do dokumentów, z których przeciwnik wyekstrahuje tekst.
Czy można zredagować konkretny obszar zamiast tekstu?
Redakcja przez wybór obszaru (przeciągnij prostokąt na stronie) jest w planach. Aktualna wersja to wpisz-by-znaleźć, świetna do e-maili, nazwisk, telefonów i dowolnych wzorców tekstowych.
Dokąd trafia mój plik?
Donikąd. Redakcja odbywa się w całości w tej karcie. Można sprawdzić w DevTools → Network: nic nie jest wysyłane.