Redigir texto num PDF
no seu navegador.
Digite as palavras a ocultar — cada ocorrência em cada página é coberta. Sem upload, sem fugas. (Edição visual, não nível forense — ver FAQ.)
Verifique você mesmo: abra o DevTools → separador Network → solte um ficheiro. Veja zero envios a acontecer.
Três passos. O seu ficheiro nunca sai deste separador.
Largue o PDF
Escolha o ficheiro a redigir. Carrega na memória do navegador, não num servidor.
Digite os padrões
Nomes, e-mails, telefones — um por linha ou separados por vírgulas. Encontramos cada correspondência.
Descarregue a cópia redigida
Cada correspondência fica coberta com um retângulo preto opaco em cada página. O original fica intacto.
Tapar texto que não quer partilhar
As razões para censurar (redact) um PDF normalmente prendem-se com esconder partes de um documento mantendo o resto legível. Um contrato com a morada da contraparte segue para um terceiro revisor que não devia ver essa morada. Uma referência médica é partilhada com uma seguradora onde o identificador do paciente deve ficar oculto. Um relatório financeiro é anexado a uma pasta de conselho mas os números de conta ao nível de unidade têm de ficar tapados. Uma proposta de projeto é mostrada a fornecedores candidatos com a linha de orçamento riscada para que proponham sem se ancorarem no número. A tarefa aqui é pequena e previsível: digita as palavras ou frases a esconder e a ferramenta desenha um retângulo preto opaco sobre cada ocorrência em cada página.
Leia isto com atenção antes de censurar algo sensível: isto é censura visual, não forense. Os retângulos pretos tapam o texto no ecrã e na impressão, mas o texto subjacente fica no ficheiro. Quem tenha uma ferramenta PDF consegue extraí-lo via copiar-colar, pesquisa ou inspeção do content-stream. É apropriado quando leitores casuais não devem ver o texto — envio de rascunho, esconder números de conta não públicos a um colega, mascarar o seu número de telefone numa captura. Não é apropriado para publicações ao abrigo de leis de transparência, processos judiciais ou tudo onde um adversário olhe a sério.
Como funciona a correspondência
Insere um ou mais padrões. Cada padrão é procurado como correspondência whole-substring sem sensibilidade a maiúsculas contra fragmentos de texto dentro do PDF. Quando um fragmento contém o seu padrão, é desenhado um retângulo preto sobre todo o bounding rect do fragmento.
Consequências práticas:
- Correspondência por substring, não por palavra inteira. O padrão
arttapa «art», «artist», «smart», «martin». Faça padrões suficientemente específicos — nomes completos, números de conta completos, e-mails completos. - Sem sensibilidade a maiúsculas. O padrão
Annatapa «Anna», «anna», «ANNA». - Sem regex, sem wildcards. O que digitar é a sequência literal a corresponder.
- Cobertura por fragmento. O PDF guarda texto em fragmentos; o bounding rect desenhado tapa um fragmento inteiro. Se o seu padrão atingir uma palavra num fragmento com mais texto, o texto à volta também fica tapado. Geralmente é o desejado; ocasionalmente verá mais tapado do que esperava.
- Padrões através de fronteiras de fragmentos não são apanhados. «João Silva» é um fragmento em alguns PDF e dois noutros. Se estiver dividido, o padrão não corresponderá na cadeia juntada. Adicione as partes como padrões separados:
João Silva,Silva,João.
O retângulo preto tem 1 ponto de margem em redor do bounding box detetado — para o posicionamento sub-pixel dos glifos, evitando que tiras do texto original espreitem nas bordas.
O que está oculto vs. o que continua no ficheiro
Esta secção conta mais que qualquer outra. O retângulo preto é uma instrução de desenho no content-stream da página. O texto original também está no content-stream, por baixo. Os leitores PDF mostram-nos por ordem: primeiro texto, depois retângulo por cima, por isso o retângulo vence visualmente. Mas o texto em si não é apagado.
O que isto quer dizer concretamente:
- Copiar-colar recupera o texto original. Selecionar a zona censurada no Adobe Reader e copiar dá as palavras que tentou esconder. O retângulo preto não é selecionável; o texto por baixo é.
- Os motores de busca encontram o texto. Se o PDF censurado for carregado num site, uma pesquisa pelo nome censurado fará surgir o documento.
- Voltar a guardar noutra ferramenta PDF pode manter ambas as camadas. Algumas ferramentas reconstroem o content-stream e podem largar as censuras; outras mantêm-nas.
- As ferramentas forenses extraem o original facilmente. Qualquer parser PDF consegue listar todos os content-streams de texto. O retângulo é apenas um desenho separado.
Para situações em que o texto subjacente tem realmente de desaparecer — publicações ao abrigo de leis de transparência, provas em tribunal, tudo o que vá para um adversário — precisa de outro fluxo: re-exportar o documento fonte com o texto sensível eliminado, ou converter a página em imagem e re-OCR (o que remove permanentemente a camada de texto).
O que sobrevive e o que não
- O conteúdo visível das páginas mantém-se igual. Tudo o que não correspondeu fica exatamente como estava — mesmas fontes, mesma paginação, mesmas imagens.
- Marcadores, anotações, ligações, campos de formulário — tudo sobrevive. Os retângulos são adições desenhadas; nada mais é reconstruído.
- O texto original fica preservado por baixo. Ver secção acima. É a limitação central.
- As assinaturas digitais ficam inválidas. Qualquer modificação ao documento, incluindo adicionar retângulos, quebra a ligação da assinatura.
- PDFs encriptados têm de ser desbloqueados primeiro. Passe por unlock-pdf com a palavra-passe antes de censurar.
Se algo parecer estranho
- «At least one redaction pattern required». A lista de padrões estava vazia. Escreva pelo menos uma palavra ou frase.
- O padrão correspondeu mas tapou mais texto do que esperado. O PDF guardou aquela linha como um único fragmento, e o retângulo é por fragmento. Geralmente aceitável; se for problema, é preciso re-exportar a fonte com o texto bem removido.
- O padrão não correspondeu ao que eu esperava. Três causas habituais: (1) o texto está numa imagem digitalizada, não numa camada de texto — a ferramenta não vê texto em imagens; OCR primeiro via pdf-to-txt ou ferramenta dedicada. (2) O padrão atravessa fragmentos — corte em mais curtos. (3) O PDF usa caracteres não latinos com codificação partida; copiar-colar de um visualizador para ver o que lá está realmente é o diagnóstico mais rápido.
- Censurei mas um colega extraiu o texto por copiar-colar. A funcionar como documentado — apenas censura visual. Para remoção real, re-exporte da fonte.
Notas práticas
- Use para esconder visualmente, não para cenários adversariais. Esconder um nome num rascunho enviado a um amigo que não vai extrair: ok. Esconder um nome num processo judicial onde a parte contrária passará ferramentas forenses: não ok.
- Padrões específicos antes de genéricos. Censure
+351-21-555-0123, não0123. Censure[email protected], nãojane. Padrões específicos sobrepõem-se menos e escondem igualmente o que pretendia. - Verifique copiando. Após censurar, abra o resultado num visualizador, selecione a zona censurada, copie. Se sair o texto original, confirmou a limitação — prossiga apenas se a ocultação visual chegar.
- Para remoção duradoura, use a fonte. Se o documento veio do Word, edite o Word e re-exporte. De uma BD, re-consulte sem os campos sensíveis. A ferramenta de censura PDF serve para casos sem fonte.
- O ficheiro original fica intacto. O que descarrega é um PDF censurado novo; a fonte em disco não muda.
O que acontece ao seu ficheiro
A censura corre no seu browser. Os padrões digitados e o conteúdo do ficheiro nunca saem deste separador. Abra DevTools e veja o separador Network durante a operação — nenhum pedido de saída com o conteúdo do ficheiro ou os padrões. O PDF fica em disco; a versão censurada é um download novo ao lado.
Perguntas frequentes
Toda a ocorrência será redigida?
Sim — varremos cada página e cobrimos cada correspondência de cada padrão indicado. Não há modo \"só primeira ocorrência\"; a edição é global por design.
É edição de nível forense?
Não. O nosso MVP pinta retângulos opacos sobre cada correspondência — visualmente está redigido, mas o texto original continua no fluxo do PDF. Para edição forense (texto removido do ficheiro, não só ocultado) use uma ferramenta de desktop como o Adobe Acrobat Pro. Somos transparentes sobre este compromisso.
Então porquê edição visual?
Na maioria dos casos — partilhar um contrato modelo, esconder um telefone num screenshot, apagar nomes num portefólio — a edição visual basta e é muito mais rápida que abrir o Acrobat. Só não use para documentos onde a outra parte extrairá o texto.
Posso redigir uma região em vez de texto?
Edição por seleção de região (arrastar um retângulo) está no roadmap. A versão atual é procurar-por-digitar, ótima para e-mails, nomes, telefones e qualquer padrão textual.
Para onde vai o meu ficheiro?
Para lado nenhum. A edição acontece inteiramente neste separador. Verificável em DevTools → Network: não há upload.