PDF 텍스트 검정 가림
브라우저에서.
검게 가릴 단어를 입력 — 모든 페이지의 모든 등장이 덮입니다. 업로드 없음, 유출 없음. (시각적 가림이며 포렌식 수준은 아닙니다 — FAQ 참고.)
직접 확인하세요: DevTools 열기 → Network 탭 → 파일 드롭. 업로드가 전혀 없음을 확인할 수 있습니다.
세 단계. 파일은 이 탭을 떠나지 않습니다.
PDF 드롭
가림 처리할 파일을 선택하세요. 서버가 아닌 브라우저 메모리에 로드됩니다.
패턴 입력
이름, 이메일, 전화번호 등 — 한 줄에 하나, 또는 쉼표로 구분. 모든 일치를 찾습니다.
가림 사본 다운로드
각 일치는 모든 페이지에서 불투명한 검정 사각형으로 덮입니다. 원본 파일은 그대로입니다.
공유하고 싶지 않은 텍스트 가리기
PDF를 편집(redact)하는 이유는 보통 문서의 일부를 숨기면서 나머지는 읽을 수 있게 두는 것입니다. 상대방의 자택 주소가 들어 있는 계약서가 그 주소를 봐선 안 되는 세 번째 검토자에게 갑니다. 의료 의뢰서가 환자 식별자가 가려져야 하는 보험사와 공유됩니다. 재무제표가 이사회 자료에 첨부되지만 단위 수준의 계좌 번호는 가려져야 합니다. 프로젝트 제안서가 후보 공급업체에 예산 라인이 검게 가려진 채로 표시되어, 그들이 숫자에 닻을 내리지 않고 제안할 수 있도록 합니다. 여기서의 일은 작고 예측 가능합니다 — 숨기고 싶은 단어나 구를 입력하면, 도구가 모든 페이지의 모든 발생 위치에 불투명한 검은 직사각형을 그립니다.
민감한 것을 편집하기 전에 이를 주의 깊게 읽으세요: 이것은 시각적 편집이지 법의학적 편집이 아닙니다. 검은 직사각형은 화면과 인쇄에서 텍스트를 가리지만 기저 텍스트는 파일에 남습니다. PDF 도구를 가진 누구나 복사-붙여넣기, 검색 또는 content-stream 검사로 추출할 수 있습니다. 일반 독자가 텍스트를 봐선 안 되는 상황에 적합합니다 — 초안 발송, 동료에게 비공개 계좌 번호 숨기기, 스크린샷에서 전화번호 가리기. 정보공개법에 따른 공개, 법원 제출, 또는 적이 자세히 볼 무언가에는 적합하지 않습니다.
매칭 작동 방식
하나 이상의 패턴을 입력합니다. 각 패턴은 PDF 내부의 텍스트 조각에 대해 대소문자 구분 없는 whole-substring 매칭으로 검색됩니다. 조각이 패턴을 포함하면 조각의 전체 bounding-rect 위에 검은 직사각형이 그려집니다.
실용적인 결과:
- 부분 문자열 매칭, 전체 단어 아님. 패턴
art는 「art」, 「artist」, 「smart」, 「martin」을 가립니다. 패턴을 충분히 구체적으로 만드세요 — 전체 이름, 전체 계좌 번호, 전체 이메일. - 대소문자 구분 없음. 패턴
Anna는 「Anna」, 「anna」, 「ANNA」를 가립니다. - regex 없음, 와일드카드 없음. 입력하는 것은 매칭할 문자 그대로의 시퀀스입니다.
- 커버리지는 조각당. PDF는 텍스트를 조각으로 저장합니다; 그려진 bounding rect는 전체 조각을 가립니다. 패턴이 더 많은 텍스트를 포함하는 조각의 한 단어에 닿으면 주변 텍스트도 가려집니다. 보통 원하는 결과입니다; 가끔 예상보다 더 많이 가려진 것을 볼 수 있습니다.
- 조각 경계를 넘는 패턴은 놓칩니다. 「김철수」는 일부 PDF에서 한 조각, 다른 PDF에서 두 조각입니다. 분할되어 있으면 패턴은 결합된 문자열에서 매칭되지 않습니다. 부분을 별도 패턴으로 추가하세요:
김철수,철수,김.
검은 직사각형은 감지된 bounding box 주위에 1포인트의 패딩을 가집니다 — 글리프의 서브픽셀 배치를 위해, 원본 텍스트의 줄무늬가 가장자리에서 비치지 않도록.
무엇이 숨겨지는지 vs. 무엇이 파일에 남는지
이 섹션은 다른 어떤 것보다 중요합니다. 검은 직사각형은 페이지의 content-stream 내 그리기 명령입니다. 원본 텍스트도 그 아래의 content-stream에 있습니다. PDF 리더는 순서대로 표시합니다: 먼저 텍스트, 그 다음 위에 직사각형. 그래서 직사각형이 시각적으로 이깁니다. 그러나 텍스트 자체는 삭제되지 않습니다.
구체적으로 무슨 뜻인지:
- 복사-붙여넣기로 원본 텍스트를 가져옵니다. Adobe Reader에서 편집된 영역을 선택하고 복사하면 숨기려고 했던 단어가 나옵니다. 검은 직사각형은 선택할 수 없지만 그 아래 텍스트는 선택할 수 있습니다.
- 검색 엔진이 텍스트를 찾습니다. 편집된 PDF가 웹사이트에 업로드되면 편집된 이름으로 검색하면 문서가 표면화됩니다.
- 다른 PDF 도구에서 다시 저장하면 두 레이어를 모두 유지할 수 있습니다. 일부 도구는 content-stream을 재구축하여 편집을 떨어뜨릴 수 있습니다; 다른 도구는 유지합니다.
- 법의학 도구는 원본을 쉽게 추출합니다. 모든 PDF 파서는 모든 텍스트 content-stream을 나열할 수 있습니다. 직사각형은 단지 별도의 그림입니다.
기저 텍스트가 정말로 사라져야 하는 상황의 경우 — 투명성법에 따른 공개, 법원 증거, 적에게 가는 모든 것 — 다른 워크플로가 필요합니다: 민감한 텍스트를 삭제한 상태로 소스 문서를 다시 내보내거나, 페이지를 이미지로 변환하고 다시 OCR(텍스트 레이어를 영구적으로 제거).
무엇이 살아남고 무엇이 살아남지 않는지
- 페이지의 보이는 콘텐츠는 그대로 유지됩니다. 매칭되지 않은 모든 것은 정확히 그대로 — 같은 글꼴, 같은 레이아웃, 같은 이미지.
- 책갈피, 주석, 링크, 양식 필드 — 모두 살아남습니다. 직사각형은 추가된 그림입니다; 다른 어떤 것도 재구축되지 않습니다.
- 원본 텍스트는 아래에 보존됩니다. 위 섹션 참조. 이것이 중심 제한입니다.
- 전자 서명은 무효화됩니다. 직사각형 추가를 포함한 문서의 모든 수정은 서명 결합을 깨뜨립니다.
- 암호화된 PDF는 먼저 잠금 해제해야 합니다. 편집 전에 비밀번호로 unlock-pdf를 통과시키세요.
무언가 이상하게 보일 때
- 「At least one redaction pattern required」. 패턴 목록이 비어 있었습니다. 최소 한 단어 또는 구를 입력하세요.
- 패턴이 매칭되었지만 예상보다 더 많은 텍스트를 가렸습니다. PDF가 그 줄을 단일 조각으로 저장했고 직사각형은 조각당입니다. 보통 수용 가능합니다; 문제라면 텍스트가 제대로 제거된 상태로 소스를 다시 내보내야 합니다.
- 패턴이 예상한 것과 매칭되지 않았습니다. 일반적인 세 가지 원인: (1) 텍스트가 스캔된 이미지에 있고 텍스트 레이어가 아닙니다 — 도구는 이미지 텍스트를 보지 못합니다; 먼저 pdf-to-txt 또는 전용 도구로 OCR. (2) 패턴이 조각을 넘습니다 — 더 짧은 것으로 나누세요. (3) PDF가 깨진 인코딩의 비라틴 문자를 사용합니다; 실제로 무엇이 있는지 보기 위해 뷰어에서 복사하는 것이 가장 빠른 진단입니다.
- 편집했지만 동료가 복사-붙여넣기로 텍스트를 추출했습니다. 문서화된 대로 작동 — 시각적 편집만. 실제 제거를 위해서는 소스에서 다시 내보내세요.
실용 메모
- 시각적 숨김에 사용, 적대적 시나리오에는 안 됨. 추출하지 않을 친구에게 보내는 초안에서 이름 숨기기: 괜찮음. 상대측이 법의학 도구를 실행할 법원 제출에서 이름 숨기기: 안 됨.
- 일반 패턴보다 구체적 패턴.
+82-2-555-0123을 편집하고0123은 안 함.[email protected]을 편집하고jane은 안 함. 구체적 패턴은 과도하게 가리는 일이 적고 의도한 것을 똑같이 잘 숨깁니다. - 복사로 확인하세요. 편집 후 결과를 뷰어에서 열고 편집된 영역을 선택해 복사하세요. 원본 텍스트가 나오면 제한을 확인한 것입니다 — 시각적 숨김이 충분할 때만 진행하세요.
- 지속적 제거를 위해 소스를 사용하세요. 문서가 Word에서 생성되었다면 Word를 편집하고 다시 내보내세요. 데이터베이스에서라면 민감한 필드 없이 다시 쿼리하세요. PDF 편집 도구는 소스가 없는 경우용입니다.
- 원본 파일은 그대로 남습니다. 다운로드되는 것은 새로운 편집된 PDF; 디스크의 원본은 변하지 않습니다.
당신의 파일에 무슨 일이 일어나는지
편집은 당신의 브라우저에서 실행됩니다. 입력한 패턴과 파일 내용은 결코 이 탭을 떠나지 않습니다. DevTools를 열고 작업 중 Network 탭을 보세요 — 파일 내용이나 패턴을 실은 외부 요청은 없습니다. PDF는 디스크에 남고, 편집된 버전은 그 옆의 새 다운로드입니다.
자주 묻는 질문
모든 등장이 가려지나요?
네 — 모든 페이지를 스캔해서 입력한 모든 패턴의 모든 일치를 덮습니다. \"첫 번째 등장만\" 모드는 없으며, 설계상 가림은 전역입니다.
포렌식 수준의 가림인가요?
아닙니다. 저희 MVP는 각 일치 위에 불투명한 사각형을 그립니다 — 시각적으로는 가려졌지만, 원본 텍스트는 여전히 PDF 스트림에 남아 있습니다. 포렌식 수준 가림(파일에서 텍스트를 완전히 제거)에는 Adobe Acrobat Pro 같은 데스크톱 도구를 사용하세요. 결정에 도움이 되도록 이 트레이드오프를 투명하게 알립니다.
그렇다면 왜 시각적 가림인가요?
대부분의 사례 — 샘플 계약서 공유, 스크린샷에서 전화번호 가리기, 포트폴리오의 이름 지우기 — 에서는 시각적 가림으로 충분하며 Acrobat을 띄우는 것보다 훨씬 빠릅니다. 다만 상대측이 텍스트를 추출할 문서에는 사용하지 마세요.
텍스트 대신 특정 영역을 가릴 수 있나요?
영역 선택 가림(페이지에서 사각형을 끌기)은 로드맵에 있습니다. 현재 버전은 입력 검색이며, 이메일, 이름, 전화번호, 모든 문자열 패턴에 적합합니다.
파일은 어디로 가나요?
어디에도 가지 않습니다. 가림 처리는 이 탭 안에서 전적으로 일어납니다. DevTools → Network에서 업로드가 없는지 확인할 수 있습니다.