PDF cenzúrázása

Szöveg cenzúrázása PDF-ben
a böngészőben.

Adja meg a kitakarandó szavakat — minden előfordulás minden oldalon le lesz fedve. Feltöltés nélkül, szivárgás nélkül. (Vizuális cenzúrázás, nem törvényszéki — lásd GYIK.)

Húzza ide a cenzúrázandó PDF-et
Megnyitjuk a szerkesztőt a cenzúrázás párbeszédpanellel a fókuszban.

Győződjön meg róla: nyissa meg a DevTools → Network fület → dobjon be egy fájlt. Nézze, ahogy nulla feltöltés történik.

Gépeljen-keressen · Fekete doboz Minden egyezés lefedése minden oldalon
Ingyenes
Regisztráció nélkül
Feltöltés nélkül
Gépeljen-keressen · Fekete doboz
HOGYAN MŰKÖDIK

Három lépés. A fájlja soha nem hagyja el ezt a lapot.

1

Húzza ide a PDF-et

Válassza ki a cenzúrázandó fájlt. Betöltődik a böngésző memóriájába, nem szerverre.

2

Adja meg a mintákat

Nevek, e-mailek, telefonszámok — egy soronként, vagy vesszővel elválasztva. Megtaláljuk az összes egyezést.

3

Töltse le a cenzúrázott másolatot

Minden egyezés átlátszatlan fekete téglalappal lesz lefedve minden oldalon. Az eredeti fájl érintetlen marad.

Olyan szöveg letakarása, amit nem akarsz megosztani

A PDF redaktálásának (redact) okai többnyire a dokumentum egyes részeinek elrejtéséről szólnak, miközben a többi olvasható marad. A szerződő fél otthoni címét tartalmazó szerződés egy harmadik bírálóhoz megy, akinek nem szabad látnia ezt a címet. Egy orvosi beutaló biztosítóval való megosztásakor a páciens azonosítóját le kell takarni. Pénzügyi kimutatás kerül egy igazgatósági mappába, de az egységszintű számlaszámokat le kell takarni. Egy projektjavaslatot mutatnak jelölt szállítóknak, kifeketített költségvetési sorral, hogy a számra ne horgonyozzanak. A feladat itt kicsi és kiszámítható: beírod a rejtendő szavakat vagy mondatokat, és az eszköz egy átlátszatlan fekete téglalapot rajzol minden előfordulásra minden oldalon.

Olvasd el alaposan, mielőtt bármi érzékenyet redaktálnál: ez vizuális, nem törvényszéki redakció. A fekete téglalapok takarják a szöveget képernyőn és nyomtatáskor, de a mögöttes szöveg a fájlban marad. Bárki PDF-eszközzel kihúzhatja másol-beilleszt, keresés vagy content-stream vizsgálat útján. Akkor megfelelő, amikor véletlenszerű olvasóknak nem szabad látniuk a szöveget — vázlat küldése, nem nyilvános számlaszámok kollégától való elrejtése, telefonszámod maszkolása képernyőképen. Nem megfelelő információs törvény szerinti közzétételre, bírósági beadványra, vagy bármi olyanra, ahol egy ellenfél alaposan megnézi.

Hogyan működik az illesztés

Egy vagy több mintát adsz meg. Minden minta kis-/nagybetű érzéketlen whole-substring keresésként illesztődik a PDF-en belüli szövegtöredékekhez. Amikor egy töredék tartalmazza a mintádat, a teljes töredék bounding-rect-jére fekete téglalap rajzolódik.

Gyakorlati következmények:

  • Részstring-illesztés, nem egész szó. Az art minta lefedi az «art», «artist», «smart», «martin» szavakat. Tedd a mintákat elég specifikussá — teljes nevek, teljes számlaszámok, teljes e-mail-címek.
  • Kis-/nagybetű érzéketlen. Az Anna minta lefedi az «Anna», «anna», «ANNA» változatokat.
  • Nincs regex, nincs joker. Amit beírsz, az a literális illesztendő szekvencia.
  • Lefedés töredékenként. A PDF töredékekben tárolja a szöveget; a rajzolt bounding rect egész töredéket fed le. Ha a mintád egy szót talál egy több szöveget tartalmazó töredékben, a környező szöveg is letakarásra kerül. Általában ez kell; néha többet látsz letakarva, mint vártad.
  • A töredékhatárokon átívelő minták kimaradnak. A «Kovács János» egyes PDF-ekben egy töredék, másokban kettő. Ha szétválik, a minta nem illeszkedik az összerakott karakterláncon. Add hozzá a részeket külön mintaként: Kovács János, Kovács, János.

A fekete téglalapnak 1 pont paddingje van a felfedezett bounding box körül — a glifok szubpixeles elhelyezése miatt, hogy az eredeti szöveg csíkjai ne lessenek ki a széleken.

Mi rejtett vs. mi marad a fájlban

Ez a szakasz súlyosabb minden másnál. A fekete téglalap egy rajzolási utasítás az oldal content-streamjében. Az eredeti szöveg is a content-streamben van, alatta. PDF-olvasók sorrendben jelenítik meg: előbb szöveg, aztán fölül a téglalap, így a téglalap vizuálisan nyer. De maga a szöveg nem törlődik.

Ez konkrétan azt jelenti:

  • Másol-beilleszt visszahozza az eredeti szöveget. A redaktált terület kijelölése Adobe Readerben és másolása megadja a szavakat, amiket el akartál rejteni. A fekete téglalap nem jelölhető ki; az alatta lévő szöveg igen.
  • Keresőmotorok megtalálják a szöveget. Ha a redaktált PDF-et webhelyre töltik fel, a redaktált névre keresés előhozza a dokumentumot.
  • Más PDF-eszközben újra mentés mindkét réteget megőrizheti. Egyes eszközök újraépítik a content-streamet és elejthetik a redakciókat; mások megőrzik.
  • Törvényszéki eszközök könnyen kinyerik az eredetit. Bármely PDF-parser fel tudja sorolni az összes szöveg-content-streamet. A téglalap csak külön rajz.

Olyan helyzetekre, ahol a mögöttes szövegnek tényleg el kell tűnnie — nyilvánossági törvény szerinti közzétételek, bizonyítékok bíróságon, minden, ami ellenfélhez kerül — más workflow kell: exportáld újra a forrásdokumentumot törölt érzékeny szöveggel, vagy alakítsd át az oldalt képpé és OCR-ezd újra (ami véglegesen eltávolítja a szövegréteget).

Mi marad meg és mi nem

  • Az oldalak látható tartalma változatlan marad. Minden, ami nem illeszkedett, pontosan úgy marad, ahogy volt — ugyanazok a fontok, ugyanaz a tördelés, ugyanazok a képek.
  • Könyvjelzők, megjegyzések, hivatkozások, űrlapmezők — minden megmarad. A téglalapok hozzáadott rajzok; semmi más nem épül újra.
  • Az eredeti szöveg alatta megmarad. Lásd a fenti szakaszt. Ez a központi korlát.
  • Digitális aláírások érvénytelenné válnak. A dokumentum bármilyen módosítása, beleértve a téglalapok hozzáadását, megtöri az aláírás kötését.
  • Titkosított PDF-eket előbb fel kell oldani. Engedd át unlock-pdf-en a jelszóval redaktálás előtt.

Ha valami furcsa

  • «At least one redaction pattern required». A mintalista üres volt. Adj meg legalább egy szót vagy mondatot.
  • A minta illeszkedett, de több szöveget takart, mint vártam. A PDF azt a sort egyetlen töredékként tárolta, és a téglalap töredékenkénti. Általában elfogadható; ha probléma, a forrást újra kell exportálni helyesen eltávolított szöveggel.
  • A minta nem illeszkedett arra, amit vártam. Három szokásos ok: (1) a szöveg beolvasott képben van, nem szövegrétegben — az eszköz nem lát képi szöveget; OCR először pdf-to-txt-en vagy dedikált eszközön. (2) A minta töredékeken átível — törd rövidebbekre. (3) A PDF nem latin karaktereket használ törött kódolással; megjelenítőből másolás annak ellenőrzésére, mi van valójában ott, a leggyorsabb diagnosztika.
  • Redaktáltam, de egy kolléga másolás-beillesztéssel kihúzta a szöveget. A dokumentáció szerint működik — csak vizuális redakció. Valódi eltávolításhoz exportáld újra a forrásból.

Gyakorlati megjegyzések

  1. Vizuális rejtésre, nem ellenfél-forgatókönyvekre. Név elrejtése egy barátnak küldött vázlatban, aki nem fog kinyerni: rendben. Név elrejtése bírósági beadványban, ahol az ellenérdekű fél törvényszéki eszközöket fog futtatni: nem rendben.
  2. Specifikus minták az általánosak helyett. Redaktáld a +36-1-555-0123-at, ne a 0123-at. Redaktáld a [email protected]-ot, ne a jane-t. Specifikus minták kevésbé takarnak túl és ugyanúgy elrejtik, amit akartál.
  3. Másolással ellenőrizd. Redakció után nyisd meg az eredményt egy megjelenítőben, jelöld ki a redaktált területet, másold. Ha kijön az eredeti szöveg, megerősítetted a korlátot — csak akkor folytasd, ha vizuális rejtés elég.
  4. Tartós eltávolításhoz használd a forrást. Ha a dokumentum Wordből készült, szerkeszd a Wordöt és exportáld újra. Adatbázisból, kérdezd le újra érzékeny mezők nélkül. A PDF-redakció eszköze olyan esetekre van, amikor nincs forrás.
  5. Az eredeti fájl érintetlen marad. Amit letöltesz, az egy új redaktált PDF; a forrás a lemezen nem változik.

Mi történik a fájloddal

A redakció a böngésződben fut. A beírt minták és a fájl tartalma soha nem hagyják el ezt a fület. Nyisd meg a DevTools-t és figyeld a Network-fület a művelet alatt — semmilyen kimenő kérés a fájl tartalmával vagy mintákkal. A PDF a lemezen marad; a redaktált verzió egy új letöltés mellette.

GYIK

Gyakori kérdések

Minden előfordulás cenzúrázódik?

Igen — minden oldalt átvizsgálunk és minden megadott minta minden egyezését lefedjük. Nincs „csak első előfordulás” mód; a cenzúrázás tervezés szerint globális.

Ez törvényszéki minőségű cenzúrázás?

Nem. Az MVP-nk átlátszatlan téglalapokat fest minden egyezés fölé — vizuálisan cenzúrázott, de az alapul szolgáló szöveg még mindig a PDF streamben van. Törvényszéki cenzúrázáshoz (a szöveg teljes eltávolítása a fájlból, nem csak elrejtése) használjon asztali eszközt, mint az Adobe Acrobat Pro. Átlátszóak vagyunk ezzel a kompromisszummal kapcsolatban, hogy Ön dönthessen.

Akkor miért vizuális cenzúrázás?

A legtöbb felhasználási esethez — minta szerződés megosztása, telefonszám elrejtése egy képernyőképről, nevek kitakarása portfólióban — a vizuális cenzúrázás elegendő és sokkal gyorsabb, mint az Acrobat indítása. Csak ne használja olyan dokumentumokhoz, amelyeknél az ellenérdekű ügyvéd szöveget fog kinyerni.

Cenzúrázhatok egy adott területet szöveg helyett?

A területkijelöléses cenzúrázás (téglalap húzása az oldalon) a tervek között szerepel. A jelenlegi verzió gépeljen-keressen, ami nagyszerű e-mailekhez, nevekhez, telefonszámokhoz és bármilyen karakterlánc-alapú mintához.

Hová kerül a fájlom?

Sehová. A cenzúrázás teljes egészében ezen a böngészőfülön történik. Ellenőrizhető a DevTools → Network ablakban: nem történik feltöltés.