Redakce PDF

Začernit text v PDF
ve vašem prohlížeči.

Napište slova k začernění — každý výskyt na každé stránce se zakryje. Bez nahrávání, bez úniku. (Vizuální redakce, ne forenzní — viz FAQ.)

Přetáhněte PDF k začernění
Otevřeme editor s aktivním dialogem redakce.

Ověřte si sami: otevřete DevTools → záložku Network → přetáhněte soubor. Sledujte, jak neproběhne žádné nahrání.

Hledání slov · Černý box Zakryjte každý výskyt na každé stránce
Zdarma
Bez registrace
Bez nahrávání
Hledání slov · Černý box
JAK TO FUNGUJE

Tři kroky. Soubor nikdy neopustí tuto kartu.

1

Přetáhněte PDF

Vyberte soubor k začernění. Načte se do paměti prohlížeče, ne na server.

2

Napište vzory

Jména, e-maily, telefony — jeden na řádek nebo oddělené čárkami. Najdeme každou shodu.

3

Stáhněte začerněnou kopii

Každá shoda se zakryje neprůhledným černým obdélníkem na každé stránce. Originál zůstává nedotčený.

Zakrýt text, který nechcete sdílet

Důvody k redakci (redact) PDF se obvykle týkají skrytí částí dokumentu při zachování čitelnosti zbytku. Smlouva s domácí adresou protistrany jde třetímu recenzentovi, který by tu adresu vidět neměl. Lékařské doporučení se sdílí s pojišťovnou, kde má být identifikátor pacienta zakrytý. Účetní výkaz je přílohou pro představenstvo, ale čísla účtů na úrovni jednotky musí být zakrytá. Návrh projektu je ukazován kandidátským dodavatelům s přeškrtnutou rozpočtovou položkou, aby nezakotvili na čísle. Úkol je tu malý a předvídatelný: napíšete slova či fráze ke skrytí a nástroj nakreslí neprůhledný černý obdélník nad každý výskyt na každé stránce.

Před zakrýváním čehokoli citlivého si pečlivě přečtěte: toto je vizuální redakce, ne forenzní. Černé obdélníky zakrývají text na obrazovce a v tisku, ale podkladový text zůstává v souboru. Kdokoli s nástrojem na PDF jej vytáhne kopírováním-vkládáním, vyhledáváním nebo inspekcí content-streamu. Je to vhodné, když náhodní čtenáři text nemají vidět — odeslání návrhu, skrytí neveřejných čísel účtů kolegovi, maskování telefonního čísla na snímku. Není to vhodné pro publikace v režimu zákona o svobodném přístupu, soudní podání nebo cokoli, kde se protivník dívá pečlivě.

Jak shoda funguje

Zadáte jeden či více vzorů. Každý vzor se hledá jako case-insensitive whole-substring shoda proti textovým fragmentům uvnitř PDF. Když fragment obsahuje váš vzor, nad celým bounding-rect fragmentu se nakreslí černý obdélník.

Praktické důsledky:

  • Shoda po podřetězci, ne po celém slově. Vzor art zakryje «art», «artist», «smart», «martin». Dělejte vzory dostatečně specifické — celá jména, celá čísla účtů, celé e-maily.
  • Bez ohledu na velikost písmen. Vzor Anna zakryje «Anna», «anna», «ANNA».
  • Žádné regex, žádné zástupné znaky. Co napíšete, je doslovná sekvence ke shodě.
  • Pokrytí po fragmentech. PDF ukládá text ve fragmentech; nakreslený bounding rect zakryje celý fragment. Pokud váš vzor zasáhne slovo ve fragmentu, který obsahuje víc textu, okolní text se taky zakryje. Obvykle to chcete; někdy uvidíte víc zakrytého, než jste čekali.
  • Vzory přes hranice fragmentů se minou. «Jan Novák» je v některých PDF jeden fragment a v jiných dva. Pokud je rozdělen, vzor se na složeném řetězci neshodne. Přidejte části jako samostatné vzory: Jan Novák, Novák, Jan.

Černý obdélník má 1 bod paddingu kolem zjištěného bounding boxu — kvůli sub-pixelovému umístění glyfů, aby na okrajích nevykukovaly proužky původního textu.

Co je skryté vs. co stále v souboru

Tato sekce je důležitější než jakákoli jiná. Černý obdélník je kreslicí instrukce v content-streamu stránky. Původní text je také v content-streamu, pod ním. PDF čtečky je zobrazují v pořadí: nejprve text, pak obdélník nahoře, takže obdélník vyhrává vizuálně. Ale text sám se nemaže.

Co to konkrétně znamená:

  • Kopírování-vkládání získá původní text. Vybráním redigované oblasti v Adobe Readeru a kopírováním získáte slova, která jste chtěli skrýt. Černý obdélník není vybíratelný; text pod ním ano.
  • Vyhledávače text najdou. Pokud je redigované PDF nahráno na web, vyhledávání po redigovaném jméně vynese dokument na světlo.
  • Opětovné uložení v jiném PDF nástroji může obě vrstvy zachovat. Některé nástroje content-stream přebudují a mohly by redakce odhodit; jiné si je drží.
  • Forenzní nástroje vytáhnou originál snadno. Jakýkoli PDF parser umí vypsat všechny content-streamy textu. Obdélník je jen samostatná kresba.

Pro situace, kdy podkladový text musí opravdu zmizet — publikace v režimu transparentnosti, důkazy u soudu, vše, co jde k protivníkovi — potřebujete jiný workflow: znovu exportovat zdrojový dokument se smazaným citlivým textem, nebo převést stránku na obrázek a znovu provést OCR (což trvale odstraní textovou vrstvu).

Co přežije a co ne

  • Viditelný obsah stránek zůstává stejný. Vše, co se neshodlo, zůstává přesně jako bylo — stejné fonty, stejná sazba, stejné obrázky.
  • Záložky, anotace, odkazy, pole formuláře — vše přežije. Obdélníky jsou přidané kresby; nic jiného se nepřebudovává.
  • Původní text se zachovává pod ním. Viz sekce výše. To je ústřední omezení.
  • Digitální podpisy se zneplatní. Jakákoli úprava dokumentu, včetně přidání obdélníků, poruší vazbu podpisu.
  • Šifrovaná PDF je třeba nejprve odemknout. Protáhněte přes unlock-pdf s heslem před redakcí.

Když něco vypadá divně

  • «At least one redaction pattern required». Seznam vzorů byl prázdný. Napište alespoň jedno slovo nebo frázi.
  • Vzor se shodl, ale zakryl víc textu, než se čekalo. PDF uložilo tu linku jako jediný fragment a obdélník je po fragmentech. Obvykle přijatelné; pokud je to problém, je nutné znovu exportovat zdroj se správně odstraněným textem.
  • Vzor se neshodl s tím, co jsem čekal. Tři obvyklé příčiny: (1) text je v naskenovaném obrázku, ne v textové vrstvě — nástroj v obrázku text nevidí; nejprve OCR přes pdf-to-txt nebo dedikovaný nástroj. (2) Vzor přesahuje fragmenty — rozdělte na kratší. (3) PDF používá nelatinské znaky s rozbitým kódováním; kopírování z prohlížeče pro ověření, co tam je, je nejrychlejší diagnostika.
  • Redigoval jsem, ale kolega vytáhl text kopírováním-vkládáním. Funguje, jak je dokumentováno — pouze vizuální redakce. Pro skutečné odstranění znovu exportujte ze zdroje.

Praktické poznámky

  1. Používejte pro vizuální skrytí, ne pro scénáře s protivníkem. Skrýt jméno v návrhu odeslaném kamarádovi, který nebude extrahovat: ok. Skrýt jméno v soudním podání, kde druhá strana spustí forenzní nástroje: ne ok.
  2. Specifické vzory před generickými. Redigujte +420-2-555-0123, ne 0123. Redigujte [email protected], ne jane. Specifické vzory méně přepokrývají a stejně dobře skryjí, co jste chtěli.
  3. Ověřujte kopírováním. Po redakci otevřete výsledek v prohlížeči, vyberte redigovanou oblast, zkopírujte. Pokud vyjde původní text, omezení jste potvrdili — pokračujte jen, pokud vám vizuální skrytí stačí.
  4. Pro trvalé odstranění použijte zdroj. Pokud dokument vznikl z Wordu, upravte Word a znovu exportujte. Pokud z DB, dotažte se znovu bez citlivých polí. Nástroj redakce PDF je pro případy, kdy zdroj nemáte.
  5. Původní soubor zůstává nedotčen. Stahujete nové redigované PDF; zdroj na disku se nemění.

Co se děje s vaším souborem

Redakce běží ve vašem prohlížeči. Napsané vzory a obsah souboru tuto záložku nikdy neopouštějí. Otevřete DevTools a sledujte záložku Network během operace — žádné odchozí požadavky s obsahem souboru ani vzory. PDF zůstává na disku; redigovaná verze je nové stažení vedle něj.

FAQ

Časté dotazy

Začerní se každý výskyt?

Ano — projdeme všechny stránky a zakryjeme každou shodu každého zadaného vzoru. Není režim „jen první výskyt"; redakce je globální záměrně.

Jde o forenzní redakci?

Ne. Naše MVP překryje každou shodu neprůhledným obdélníkem — vizuálně je to začerněné, ale původní text v datovém toku PDF zůstává. Pro forenzní redakci (text úplně odstraněn ze souboru, nejen skrytý) použijte desktopový nástroj jako Adobe Acrobat Pro. Tento kompromis přiznáváme otevřeně, abyste se mohli rozhodnout.

Tak proč vizuální redakce?

Pro většinu případů — sdílení vzorové smlouvy, skrytí čísla v screenshotu, zatemnění jmen v portfoliu — stačí a je mnohem rychlejší než spouštět Acrobat. Jen nepoužívejte pro dokumenty, kde protistrana text extrahuje.

Mohu začernit konkrétní oblast místo textu?

Redakce výběrem oblasti (tažení obdélníku na stránce) je v plánu. Aktuální verze používá hledání podle textu, což je skvělé pro e-maily, jména, telefony a jakýkoliv řetězcový vzor.

Kam jde můj soubor?

Nikam. Redakce probíhá zcela v této kartě. Ověřitelné v DevTools → Network: nic se neodesílá.