Redact PDF

Redigir texto num PDF
no seu navegador.

Digite as palavras a ocultar — cada ocorrência em cada página é coberta. Sem upload, sem fugas. (Edição visual, não nível forense — ver FAQ.)

Largue um PDF para redact
Abrimos o editor com a caixa de redact já em foco.

Verifique você mesmo: abra o DevTools → separador Network → solte um ficheiro. Veja zero envios a acontecer.

Procurar-por-digitar · Caixa preta Cobrir cada correspondência em cada página
Grátis
Sem registo
Sem upload
Procurar-por-digitar · Caixa preta
COMO FUNCIONA

Três passos. O seu ficheiro nunca sai deste separador.

1

Largue o PDF

Escolha o ficheiro a redigir. Carrega na memória do navegador, não num servidor.

2

Digite os padrões

Nomes, e-mails, telefones — um por linha ou separados por vírgulas. Encontramos cada correspondência.

3

Descarregue a cópia redigida

Cada correspondência fica coberta com um retângulo preto opaco em cada página. O original fica intacto.

Tapar texto que não quer partilhar

As razões para censurar (redact) um PDF normalmente prendem-se com esconder partes de um documento mantendo o resto legível. Um contrato com a morada da contraparte segue para um terceiro revisor que não devia ver essa morada. Uma referência médica é partilhada com uma seguradora onde o identificador do paciente deve ficar oculto. Um relatório financeiro é anexado a uma pasta de conselho mas os números de conta ao nível de unidade têm de ficar tapados. Uma proposta de projeto é mostrada a fornecedores candidatos com a linha de orçamento riscada para que proponham sem se ancorarem no número. A tarefa aqui é pequena e previsível: digita as palavras ou frases a esconder e a ferramenta desenha um retângulo preto opaco sobre cada ocorrência em cada página.

Leia isto com atenção antes de censurar algo sensível: isto é censura visual, não forense. Os retângulos pretos tapam o texto no ecrã e na impressão, mas o texto subjacente fica no ficheiro. Quem tenha uma ferramenta PDF consegue extraí-lo via copiar-colar, pesquisa ou inspeção do content-stream. É apropriado quando leitores casuais não devem ver o texto — envio de rascunho, esconder números de conta não públicos a um colega, mascarar o seu número de telefone numa captura. Não é apropriado para publicações ao abrigo de leis de transparência, processos judiciais ou tudo onde um adversário olhe a sério.

Como funciona a correspondência

Insere um ou mais padrões. Cada padrão é procurado como correspondência whole-substring sem sensibilidade a maiúsculas contra fragmentos de texto dentro do PDF. Quando um fragmento contém o seu padrão, é desenhado um retângulo preto sobre todo o bounding rect do fragmento.

Consequências práticas:

  • Correspondência por substring, não por palavra inteira. O padrão art tapa «art», «artist», «smart», «martin». Faça padrões suficientemente específicos — nomes completos, números de conta completos, e-mails completos.
  • Sem sensibilidade a maiúsculas. O padrão Anna tapa «Anna», «anna», «ANNA».
  • Sem regex, sem wildcards. O que digitar é a sequência literal a corresponder.
  • Cobertura por fragmento. O PDF guarda texto em fragmentos; o bounding rect desenhado tapa um fragmento inteiro. Se o seu padrão atingir uma palavra num fragmento com mais texto, o texto à volta também fica tapado. Geralmente é o desejado; ocasionalmente verá mais tapado do que esperava.
  • Padrões através de fronteiras de fragmentos não são apanhados. «João Silva» é um fragmento em alguns PDF e dois noutros. Se estiver dividido, o padrão não corresponderá na cadeia juntada. Adicione as partes como padrões separados: João Silva, Silva, João.

O retângulo preto tem 1 ponto de margem em redor do bounding box detetado — para o posicionamento sub-pixel dos glifos, evitando que tiras do texto original espreitem nas bordas.

O que está oculto vs. o que continua no ficheiro

Esta secção conta mais que qualquer outra. O retângulo preto é uma instrução de desenho no content-stream da página. O texto original também está no content-stream, por baixo. Os leitores PDF mostram-nos por ordem: primeiro texto, depois retângulo por cima, por isso o retângulo vence visualmente. Mas o texto em si não é apagado.

O que isto quer dizer concretamente:

  • Copiar-colar recupera o texto original. Selecionar a zona censurada no Adobe Reader e copiar dá as palavras que tentou esconder. O retângulo preto não é selecionável; o texto por baixo é.
  • Os motores de busca encontram o texto. Se o PDF censurado for carregado num site, uma pesquisa pelo nome censurado fará surgir o documento.
  • Voltar a guardar noutra ferramenta PDF pode manter ambas as camadas. Algumas ferramentas reconstroem o content-stream e podem largar as censuras; outras mantêm-nas.
  • As ferramentas forenses extraem o original facilmente. Qualquer parser PDF consegue listar todos os content-streams de texto. O retângulo é apenas um desenho separado.

Para situações em que o texto subjacente tem realmente de desaparecer — publicações ao abrigo de leis de transparência, provas em tribunal, tudo o que vá para um adversário — precisa de outro fluxo: re-exportar o documento fonte com o texto sensível eliminado, ou converter a página em imagem e re-OCR (o que remove permanentemente a camada de texto).

O que sobrevive e o que não

  • O conteúdo visível das páginas mantém-se igual. Tudo o que não correspondeu fica exatamente como estava — mesmas fontes, mesma paginação, mesmas imagens.
  • Marcadores, anotações, ligações, campos de formulário — tudo sobrevive. Os retângulos são adições desenhadas; nada mais é reconstruído.
  • O texto original fica preservado por baixo. Ver secção acima. É a limitação central.
  • As assinaturas digitais ficam inválidas. Qualquer modificação ao documento, incluindo adicionar retângulos, quebra a ligação da assinatura.
  • PDFs encriptados têm de ser desbloqueados primeiro. Passe por unlock-pdf com a palavra-passe antes de censurar.

Se algo parecer estranho

  • «At least one redaction pattern required». A lista de padrões estava vazia. Escreva pelo menos uma palavra ou frase.
  • O padrão correspondeu mas tapou mais texto do que esperado. O PDF guardou aquela linha como um único fragmento, e o retângulo é por fragmento. Geralmente aceitável; se for problema, é preciso re-exportar a fonte com o texto bem removido.
  • O padrão não correspondeu ao que eu esperava. Três causas habituais: (1) o texto está numa imagem digitalizada, não numa camada de texto — a ferramenta não vê texto em imagens; OCR primeiro via pdf-to-txt ou ferramenta dedicada. (2) O padrão atravessa fragmentos — corte em mais curtos. (3) O PDF usa caracteres não latinos com codificação partida; copiar-colar de um visualizador para ver o que lá está realmente é o diagnóstico mais rápido.
  • Censurei mas um colega extraiu o texto por copiar-colar. A funcionar como documentado — apenas censura visual. Para remoção real, re-exporte da fonte.

Notas práticas

  1. Use para esconder visualmente, não para cenários adversariais. Esconder um nome num rascunho enviado a um amigo que não vai extrair: ok. Esconder um nome num processo judicial onde a parte contrária passará ferramentas forenses: não ok.
  2. Padrões específicos antes de genéricos. Censure +351-21-555-0123, não 0123. Censure [email protected], não jane. Padrões específicos sobrepõem-se menos e escondem igualmente o que pretendia.
  3. Verifique copiando. Após censurar, abra o resultado num visualizador, selecione a zona censurada, copie. Se sair o texto original, confirmou a limitação — prossiga apenas se a ocultação visual chegar.
  4. Para remoção duradoura, use a fonte. Se o documento veio do Word, edite o Word e re-exporte. De uma BD, re-consulte sem os campos sensíveis. A ferramenta de censura PDF serve para casos sem fonte.
  5. O ficheiro original fica intacto. O que descarrega é um PDF censurado novo; a fonte em disco não muda.

O que acontece ao seu ficheiro

A censura corre no seu browser. Os padrões digitados e o conteúdo do ficheiro nunca saem deste separador. Abra DevTools e veja o separador Network durante a operação — nenhum pedido de saída com o conteúdo do ficheiro ou os padrões. O PDF fica em disco; a versão censurada é um download novo ao lado.

FAQ

Perguntas frequentes

Toda a ocorrência será redigida?

Sim — varremos cada página e cobrimos cada correspondência de cada padrão indicado. Não há modo \"só primeira ocorrência\"; a edição é global por design.

É edição de nível forense?

Não. O nosso MVP pinta retângulos opacos sobre cada correspondência — visualmente está redigido, mas o texto original continua no fluxo do PDF. Para edição forense (texto removido do ficheiro, não só ocultado) use uma ferramenta de desktop como o Adobe Acrobat Pro. Somos transparentes sobre este compromisso.

Então porquê edição visual?

Na maioria dos casos — partilhar um contrato modelo, esconder um telefone num screenshot, apagar nomes num portefólio — a edição visual basta e é muito mais rápida que abrir o Acrobat. Só não use para documentos onde a outra parte extrairá o texto.

Posso redigir uma região em vez de texto?

Edição por seleção de região (arrastar um retângulo) está no roadmap. A versão atual é procurar-por-digitar, ótima para e-mails, nomes, telefones e qualquer padrão textual.

Para onde vai o meu ficheiro?

Para lado nenhum. A edição acontece inteiramente neste separador. Verificável em DevTools → Network: não há upload.