Замазати PDF

Замазати текст у PDF
у вашому браузері.

Введіть слова для замазування — кожне входження на кожній сторінці буде закрите. Без завантаження, без витоку. (Візуальна редакція, не рівня криміналістики — див. FAQ.)

Перетягніть PDF для замазування
Відкриємо редактор з активним вікном замазування.

Переконайтеся самі: відкрийте DevTools → вкладку Network → перетягніть файл. Ви побачите, що жодних завантажень на сервер не відбувається.

Пошук текстом · Чорний блок Закрити кожен збіг на кожній сторінці
Безкоштовно
Без реєстрації
Без завантаження
Пошук текстом · Чорний блок
ЯК ЦЕ ПРАЦЮЄ

Три кроки. Ваш файл не покидає цю вкладку.

1

Перетягніть PDF

Виберіть файл для замазування. Він завантажується в пам'ять браузера, а не на сервер.

2

Введіть шаблони

Імена, e-mail, телефони — по одному в рядку або через кому. Ми знаходимо кожен збіг.

3

Завантажте замазану копію

Кожен збіг закривається непрозорим чорним прямокутником на кожній сторінці. Оригінал залишається незмінним.

Закрити текст, який не має піти

Причини редагувати (redact) PDF зазвичай про те, щоб приховати частини документа, лишивши решту читабельною. Договір з домашньою адресою контрагента йде третьому рецензенту, якому цю адресу бачити не треба. Медичне направлення ділиться зі страховою, де ідентифікатор пацієнта має бути закритий. Фінансова звітність додається до пакету для ради директорів, але номери рахунків на рівні юніту мають бути закриті. Проєктна пропозиція показується кандидатам-підрядникам із закресленим рядком бюджету, щоб не якорити їх на цифрі. Завдання тут маленьке і передбачуване: вводите слова або фрази, які треба сховати, і інструмент малює непрозорий чорний прямокутник над кожним входженням на кожній сторінці.

Прочитайте уважно перед тим, як редагувати щось чутливе: це візуальна редакція, не криміналістична. Чорні прямокутники закривають текст на екрані та при друці, але сам текст лишається у файлі. Будь-хто з PDF-інструментом витягне його через копіювання, пошук або інспекцію content-stream. Це доречно, коли «випадкові» читачі не повинні бачити текст — надсилання чернетки, приховування непублічних номерів рахунків від колеги, маскування номера телефону на скриншоті. Це недоречно для публікацій за законом про доступ до інформації, судових подань або всього, де противник шукатиме всерйоз.

Як працює збіг

Ви вводите один або кілька патернів. Кожен патерн шукається як нечутливий до регістру whole-substring проти фрагментів тексту всередині PDF. Коли фрагмент містить ваш патерн, над усім bounding-rect фрагмента малюється чорний прямокутник.

Практичні наслідки:

  • Підрядковий збіг, не за цілим словом. Патерн art закриє «art», «artist», «smart», «martin». Робіть патерни достатньо специфічними — повні імена, повні номери рахунків, повні e-mail.
  • Регістронезалежно. Патерн Анна закриє «Анна», «анна», «АННА».
  • Жодних regex чи wildcard. Що ви набрали — то й буквальна послідовність для збігу.
  • Покриття пофрагментне. PDF зберігає текст фрагментами; малюваний bounding rect закриває цілий фрагмент. Якщо патерн зачепив одне слово у фрагменті, де більше тексту, навколишній текст теж закриється. Зазвичай це те, що треба; іноді побачите більше закритого, ніж очікували.
  • Патерни через межі фрагментів не ловляться. «Іван Петренко» — один фрагмент в одних PDF і два в інших. Якщо рознесений, патерн не спрацює на склеєному рядку. Додайте частини як окремі патерни: Іван Петренко, Петренко, Іван.

У чорного прямокутника є 1 пункт паддингу навколо знайденого bounding box — облік субпіксельного розміщення гліфів, щоб смужки вихідного тексту не виглядали по краях.

Що сховано vs. що лишається у файлі

Ця секція важливіша за будь-яку іншу. Чорний прямокутник — це інструкція малювання в content-stream сторінки. Початковий текст теж у content-stream, під ним. PDF-рідери відображають їх по порядку: спочатку текст, потім прямокутник згори, тож прямокутник перемагає візуально. Але сам текст не видаляється.

Що це означає конкретно:

  • Копіювання повертає початковий текст. Виділення редагованої області в Adobe Reader і копіювання дає слова, які ви намагалися сховати. Чорний прямокутник не виділяється; текст під ним — виділяється.
  • Пошуковики знаходять текст. Якщо редагований PDF завантажений на сайт, пошук за прихованим імʼям поверне документ.
  • Пере-збереження в іншому PDF-інструменті може зберегти обидва шари. Деякі інструменти пере-збирають content-stream і можуть скинути редакції; інші зберігають.
  • Криміналістичні інструменти витягують вихідник легко. Будь-який PDF-парсер перелічить усі content-streams тексту. Прямокутник — це просто окремий малюнок.

Для ситуацій, де підлеглий текст має реально зникнути — публікації в рамках законів про прозорість, докази в суді, все, що піде противнику — потрібен інший workflow: пере-експортуйте вихідний документ із видаленим чутливим текстом, або конвертуйте сторінку в зображення та пере-OCR (що назавжди видаляє текстовий шар).

Що переживе операцію, а що ні

  • Видимий вміст сторінок лишається таким самим. Усе, що не збіглося, лишається саме як було — ті ж шрифти, та ж верстка, ті ж зображення.
  • Закладки, анотації, посилання, поля форм — усе переживає. Прямокутники — це додані малюнки; ніщо інше не пере-збирається.
  • Початковий текст зберігається під прямокутником. Див. секцію вище. Це центральне обмеження.
  • Цифрові підписи анулюються. Будь-яка модифікація документа, включно з додаванням прямокутників, ламає звʼязок із підписом.
  • Зашифровані PDF треба спершу розблокувати. Проженіть через unlock-pdf з паролем перед редакцією.

Якщо щось виглядає не так

  • «At least one redaction pattern required». Список патернів був порожній. Введіть хоча б одне слово або фразу.
  • Патерн збігся, але закрив більше тексту, ніж очікувалось. PDF зберігає той рядок як один фрагмент, і прямокутник пофрагментний. Зазвичай прийнятно; якщо проблема, джерело треба пере-експортувати з видаленим текстом правильно.
  • Патерн не збігся з тим, що я очікував. Три звичайні причини: (1) текст у скан-зображенні, не в текстовому шарі — інструмент не бачить текст у зображенні; спершу OCR через pdf-to-txt або спеціалізований інструмент. (2) Патерн перетинає фрагменти — розбийте на коротші. (3) PDF використовує нелатинські символи зі зламаним кодуванням; копіювання з переглядача для перевірки того, що там реально — найшвидша діагностика.
  • Я відредагував, але колега витягнув текст через копіювання. Працює як задокументовано — лише візуальна редакція. Для реального видалення — пере-експорт з джерела.

Практичні нотатки

  1. Використовуйте для візуального приховування, не для ворожих сценаріїв. Сховати імʼя в чернетці, надісланій другу, що не витягуватиме: ок. Сховати імʼя в судовій подачі, де протилежна сторона прожене криміналістичні інструменти: не ок.
  2. Специфічні патерни замість загальних. Редагуйте +380-44-555-0123, не 0123. Редагуйте [email protected], не jane. Специфічні патерни менше over-match і однаково ховають те, що ви хотіли.
  3. Перевіряйте копіюванням. Після редакції відкрийте результат у переглядачі, виділіть редаговану область, скопіюйте. Якщо вийде вихідний текст — ви підтвердили обмеження; продовжуйте лише якщо візуального приховування достатньо.
  4. Для тривалого видалення — використовуйте джерело. Якщо документ з Word — редагуйте Word і пере-експортуйте. Якщо з БД — переспросіть без чутливих полів. Інструмент редакції PDF — для випадків, коли джерела немає.
  5. Початковий файл лишається недоторканим. Завантажується новий редагований PDF; джерело на диску не змінюється.

Що відбувається з вашим файлом

Редакція працює в браузері. Введені патерни та вміст файлу ніколи не покидають цю вкладку. Відкрийте DevTools і спостерігайте вкладку Network під час операції — жодних вихідних запитів зі вмістом файлу чи патернами. PDF лишається на диску; редагована версія — це нове завантаження поруч.

FAQ

Часті запитання

Чи буде замазано кожне входження?

Так — ми проходимо по кожній сторінці й закриваємо кожен збіг кожного введеного шаблону. Режиму «лише перше входження» немає; замазування глобальне за задумом.

Чи це редакція криміналістичного рівня?

Ні. Наш MVP малює непрозорі прямокутники над кожним збігом — візуально замазано, але вихідний текст залишається у потоці PDF. Для криміналістичної редакції (повне видалення тексту з файлу) використовуйте десктопний інструмент на кшталт Adobe Acrobat Pro. Ми відкрито говоримо про цей компроміс.

Чому тоді візуальна редакція?

Для більшості випадків — поділитися зразком договору, сховати телефон на скриншоті, замазати імена у портфоліо — візуальної редакції достатньо, і це швидше за запуск Acrobat. Просто не використовуйте для документів, з яких опонент витягуватиме текст.

Чи можна замазувати область замість тексту?

Замазування виділенням області (перетягнути прямокутник на сторінці) у дорожній карті. Поточна версія — пошук текстом, що чудово підходить для e-mail, імен, телефонів та будь-яких рядкових шаблонів.

Куди йде мій файл?

Нікуди. Замазування відбувається повністю в цій вкладці. Перевірте в DevTools → Network — нічого не надсилається.