Cenzurează text într-un PDF
în browserul tău.
Dactilografiază cuvintele de acoperit — fiecare apariție pe fiecare pagină este acoperită. Fără încărcare, fără scurgeri. (Cenzurare vizuală, nu forensică — vezi FAQ.)
Verifică tu însuți: deschide DevTools → fila Network → trage un fișier. Vei vedea zero încărcări.
Trei pași. Fișierul tău nu părăsește niciodată această filă.
Trage PDF-ul
Alege fișierul pe care vrei să-l cenzurezi. Se încarcă în memoria browserului tău, nu pe un server.
Dactilografiază tiparele
Nume, e-mailuri, numere de telefon — câte unul pe rând sau separate prin virgule. Găsim fiecare potrivire.
Descarcă copia cenzurată
Fiecare potrivire este acoperită cu un dreptunghi negru opac pe fiecare pagină. Fișierul original rămâne intact.
A acoperi text pe care nu vrei să-l împărtășești
Motivele de a redacta (redact) un PDF țin de obicei de a ascunde părți dintr-un document păstrând restul lizibil. Un contract cu adresa de domiciliu a contraparții merge la un al treilea recenzent care n-ar trebui să vadă acea adresă. O trimitere medicală e împărtășită cu un asigurator unde identificatorul pacientului trebuie să fie acoperit. Un raport financiar e atașat unui dosar pentru consiliu, dar numerele de cont la nivel de unitate trebuie acoperite. O propunere de proiect e arătată unor furnizori candidați cu linia de buget înnegrită, ca să propună fără a se ancora pe cifră. Sarcina aici e mică și previzibilă: tastezi cuvintele sau frazele de ascuns, iar unealta desenează un dreptunghi negru opac peste fiecare apariție pe fiecare pagină.
Citește cu atenție înainte de a redacta ceva sensibil: aceasta este redactare vizuală, nu criminalistică. Dreptunghiurile negre acoperă textul pe ecran și la imprimare, dar textul de dedesubt rămâne în fișier. Oricine cu o unealtă PDF îl poate scoate prin copy-paste, căutare sau inspectarea content-stream. Este potrivit când cititorii ocazionali nu trebuie să vadă textul — trimiterea unei ciorne, ascunderea numerelor de cont nepublice de un coleg, mascarea numărului tău de telefon pe o captură. Nu e potrivit pentru publicări sub legea liberului acces la informație, depuneri judiciare sau orice unde un adversar va privi atent.
Cum funcționează potrivirea
Introduci unul sau mai multe pattern-uri. Fiecare pattern e căutat ca potrivire whole-substring fără sensibilitate la majuscule împotriva fragmentelor de text din PDF. Când un fragment conține pattern-ul tău, peste tot bounding-rect-ul fragmentului se desenează un dreptunghi negru.
Consecințe practice:
- Potrivire pe sub-șir, nu pe cuvânt întreg. Pattern-ul
artacoperă «art», «artist», «smart», «martin». Fă pattern-uri suficient de specifice — nume complete, numere de cont complete, e-mail-uri complete. - Fără sensibilitate la majuscule. Pattern-ul
Annaacoperă «Anna», «anna», «ANNA». - Fără regex, fără wildcard. Ce tastezi este secvența literală pentru potrivire.
- Acoperire pe fragment. PDF stochează text în fragmente; bounding rect-ul desenat acoperă un fragment întreg. Dacă pattern-ul lovește un cuvânt într-un fragment cu mai mult text, textul din jur se acoperă și el. De obicei e ce vrei; uneori vei vedea mai mult acoperit decât te așteptai.
- Pattern-urile care traversează limite de fragmente sunt ratate. «Ion Popescu» e un fragment în unele PDF-uri și două în altele. Dacă e divizat, pattern-ul nu se va potrivi pe șirul concatenat. Adaugă părțile ca pattern-uri separate:
Ion Popescu,Popescu,Ion.
Dreptunghiul negru are 1 punct de padding în jurul bounding box-ului detectat — pentru plasarea sub-pixel a glifelor, ca să nu iasă fâșii din textul original pe margini.
Ce e ascuns vs. ce rămâne în fișier
Această secțiune contează mai mult decât orice alta. Dreptunghiul negru e o instrucțiune de desen în content-stream-ul paginii. Textul original e și el în content-stream, dedesubt. Cititoarele PDF le afișează în ordine: întâi textul, apoi dreptunghiul deasupra, deci dreptunghiul învinge vizual. Dar textul în sine nu e șters.
Ce înseamnă concret:
- Copy-paste recuperează textul original. Selectarea zonei redactate în Adobe Reader și copierea dau cuvintele pe care le-ai vrut ascunse. Dreptunghiul negru nu poate fi selectat; textul de dedesubt poate.
- Motoarele de căutare găsesc textul. Dacă PDF-ul redactat e încărcat pe un site, o căutare după numele redactat va aduce documentul la suprafață.
- Resalvarea în alt instrument PDF poate păstra ambele straturi. Unele unelte reconstruiesc content-stream-ul și pot pierde redactările; altele le păstrează.
- Uneltele criminalistice scot originalul ușor. Orice parser PDF poate lista toate content-stream-urile de text. Dreptunghiul e doar un desen separat.
Pentru situații în care textul de dedesubt chiar trebuie să dispară — publicări sub lege a transparenței, probe în instanță, tot ce merge la un adversar — ai nevoie de alt workflow: reexportă documentul-sursă cu textul sensibil șters, sau convertește pagina în imagine și fă OCR din nou (ceea ce elimină permanent stratul de text).
Ce supraviețuiește și ce nu
- Conținutul vizibil al paginilor rămâne același. Tot ce nu s-a potrivit rămâne exact cum era — aceleași fonturi, aceeași machetare, aceleași imagini.
- Marcaje, adnotări, link-uri, câmpuri de formular — toate supraviețuiesc. Dreptunghiurile sunt adăugiri desenate; nimic altceva nu se reconstruiește.
- Textul original e păstrat dedesubt. Vezi secțiunea de mai sus. Aceasta e limitarea centrală.
- Semnăturile digitale se invalidează. Orice modificare a documentului, inclusiv adăugarea de dreptunghiuri, rupe legarea semnăturii.
- PDF-urile criptate trebuie deblocate mai întâi. Treci prin unlock-pdf cu parola înainte de redactare.
Dacă ceva pare ciudat
- «At least one redaction pattern required». Lista de pattern-uri era goală. Tastează cel puțin un cuvânt sau o frază.
- Pattern-ul s-a potrivit dar a acoperit mai mult text decât așteptai. PDF-ul a stocat acea linie ca un singur fragment, iar dreptunghiul e pe fragment. De obicei acceptabil; dacă e o problemă, sursa trebuie reexportată cu textul șters corect.
- Pattern-ul nu s-a potrivit cu ce așteptam. Trei cauze obișnuite: (1) textul e într-o imagine scanată, nu într-un strat de text — unealta nu vede text în imagini; OCR mai întâi prin pdf-to-txt sau o unealtă dedicată. (2) Pattern-ul traversează fragmente — împarte în mai scurte. (3) PDF-ul folosește caractere non-latine cu codificare stricată; copy-paste din vizualizator pentru a vedea ce e cu adevărat acolo e cea mai rapidă diagnoză.
- Am redactat dar un coleg a scos textul prin copy-paste. Funcționează cum e documentat — doar redactare vizuală. Pentru ștergere reală reexportă din sursă.
Note practice
- Folosește pentru ascundere vizuală, nu pentru scenarii adversariale. A ascunde un nume într-o ciornă trimisă unui prieten care nu va extrage: ok. A ascunde un nume într-o depunere judiciară unde partea adversă va rula unelte criminalistice: nu ok.
- Pattern-uri specifice înaintea celor generice. Redactează
+40-21-555-0123, nu0123. Redactează[email protected], nujane. Pattern-urile specifice supra-acoperă mai puțin și ascund la fel ce ai vrut. - Verifică prin copiere. După redactare, deschide rezultatul într-un vizualizator, selectează zona redactată, copiază. Dacă iese textul original, ai confirmat limitarea — continuă doar dacă ascunderea vizuală e suficientă.
- Pentru ștergere durabilă, folosește sursa. Dacă documentul vine din Word, editează Word-ul și reexportă. Dintr-o bază, reinterogheaz-o fără câmpurile sensibile. Unealta de redactare PDF e pentru cazurile în care nu ai sursa.
- Fișierul original rămâne neatins. Ce descarci e un PDF redactat nou; sursa de pe disc nu se schimbă.
Ce se întâmplă cu fișierul tău
Redactarea rulează în browserul tău. Pattern-urile tastate și conținutul fișierului nu părăsesc niciodată această filă. Deschide DevTools și urmărește fila Network în timpul operațiunii — niciun request ieșit cu conținut de fișier sau pattern-uri. PDF-ul rămâne pe disc; versiunea redactată e o descărcare nouă alături.
Întrebări frecvente
Fiecare apariție va fi cenzurată?
Da — scanăm fiecare pagină și acoperim fiecare potrivire a fiecărui tipar dactilografiat. Nu există un mod „doar prima apariție”; cenzurarea este globală prin design.
Este cenzurare de nivel forensic?
Nu. MVP-ul nostru aplică dreptunghiuri opace peste fiecare potrivire — vizual este cenzurat, dar textul de bază este încă în stream-ul PDF. Pentru cenzurare forensică (text complet eliminat din fișier, nu doar ascuns), folosește un instrument desktop precum Adobe Acrobat Pro. Suntem transparenți cu privire la acest compromis pentru a putea decide tu.
Atunci de ce cenzurare vizuală?
Pentru majoritatea cazurilor — partajarea unui contract eșantion, ascunderea unui număr de telefon dintr-o captură, ștergerea numelor dintr-un portofoliu — cenzurarea vizuală este suficientă și mult mai rapidă decât pornirea Acrobat. Doar nu o folosi pentru documente din care avocatul opus va extrage text.
Pot cenzura o regiune specifică în loc de text?
Cenzurarea prin selectarea unei regiuni (trage un dreptunghi pe pagină) este în plan. Versiunea actuală caută prin dactilografiere, ceea ce este excelent pentru e-mailuri, nume, numere de telefon și orice tipar bazat pe șir.
Unde merge fișierul meu?
Nicăieri. Cenzurarea are loc integral în această filă a browserului. Verificabil în DevTools → Network: nicio încărcare nu are loc.