Redigir PDF

Redigir texto em um PDF
no navegador.

Digite as palavras a ocultar — toda ocorrência em cada página é coberta. Sem upload, sem vazamento. (Redação visual, não nível forense — veja o FAQ.)

Solte um PDF para redigir
Abrimos o editor com o diálogo de redação já em foco.

Verifique você mesmo: abra o DevTools → aba Network → solte um arquivo. Veja zero uploads acontecerem.

Digitar para encontrar · Caixa preta Cubra cada correspondência em cada página
Grátis
Sem cadastro
Sem upload
Digitar para encontrar · Caixa preta
COMO FUNCIONA

Três passos. Seu arquivo nunca sai desta aba.

1

Solte seu PDF

Escolha o arquivo a redigir. Ele carrega na memória do navegador, não em um servidor.

2

Digite os padrões

Nomes, e-mails, telefones — um por linha ou separados por vírgulas. Encontramos toda correspondência.

3

Baixe a cópia redigida

Cada correspondência fica coberta por um retângulo preto opaco em cada página. O original fica intacto.

Cobrir texto que você não quer compartilhar

As razões para tarjar (redact) um PDF normalmente são pra esconder partes de um documento mantendo o resto legível. Um contrato com o endereço de casa de uma contraparte vai pra um terceiro revisor que não deveria ver esse endereço. Um encaminhamento médico é compartilhado com um plano de saúde onde o identificador do paciente precisa ficar coberto. Uma demonstração financeira é anexada a uma pasta pro conselho mas os números de conta no nível de unidade precisam ficar tampados. Uma proposta de projeto é mostrada pra fornecedores candidatos com a linha de orçamento riscada pra eles proporem sem ancorar no número. A tarefa aqui é pequena e previsível: digita as palavras ou frases que quer esconder e a ferramenta desenha um retângulo preto opaco sobre cada ocorrência em cada página.

Lê isso com atenção antes de tarjar algo sensível: isso é tarjeamento visual, não forense. Os retângulos pretos cobrem o texto na tela e na impressão, mas o texto subjacente fica no arquivo. Qualquer um com uma ferramenta PDF consegue extrair via copiar-colar, busca ou inspeção do content-stream. É apropriado quando leitores casuais não devem ver o texto — enviar rascunho, esconder números de conta não públicos pro colega, mascarar seu telefone num print. Não é apropriado pra publicações sob lei de acesso à informação, peças judiciais, ou qualquer coisa onde um adversário olha de perto.

Como o match funciona

Você entra com um ou mais padrões. Cada padrão é buscado como match whole-substring case-insensitive contra fragmentos de texto dentro do PDF. Quando um fragmento contém seu padrão, é desenhado um retângulo preto sobre todo o bounding rect do fragmento.

Consequências práticas:

  • Match por substring, não por palavra inteira. O padrão art cobre «art», «artist», «smart», «martin». Faz padrões específicos o bastante — nomes completos, números de conta completos, e-mails completos.
  • Case-insensitive. O padrão Anna cobre «Anna», «anna», «ANNA».
  • Sem regex, sem coringa. O que você digita é a sequência literal pra match.
  • Cobertura por fragmento. O PDF guarda texto em fragmentos; o bounding rect desenhado cobre um fragmento inteiro. Se seu padrão pega numa palavra dentro de um fragmento que tem mais texto, o texto em volta também é coberto. Geralmente é o que você quer; às vezes vê mais coberto do que esperava.
  • Padrões cruzando fronteiras de fragmento são perdidos. «João Silva» é um fragmento em alguns PDFs e dois em outros. Se está dividido, o padrão não vai bater na string juntada. Adiciona as partes como padrões separados: João Silva, Silva, João.

O retângulo preto tem 1 ponto de padding em volta do bounding box detectado — pra colocação subpixel dos glifos, evitando que tirinhas do texto original espiem nas bordas.

O que está escondido vs. o que continua no arquivo

Essa seção importa mais que qualquer outra. O retângulo preto é uma instrução de desenho no content-stream da página. O texto original também tá no content-stream, embaixo. Os leitores PDF mostram em ordem: primeiro texto, depois retângulo em cima, então o retângulo vence visualmente. Mas o texto em si não é apagado.

O que isso significa concretamente:

  • Copiar-colar recupera o texto original. Selecionar a área tarjada no Adobe Reader e copiar dá as palavras que você tentou esconder. O retângulo preto não é selecionável; o texto embaixo é.
  • Buscadores acham o texto. Se o PDF tarjado é subido pra um site, uma busca pelo nome tarjado traz o documento à tona.
  • Resalvar em outra ferramenta PDF pode manter as duas camadas. Algumas ferramentas reconstroem o content-stream e podem soltar as tarjas; outras mantêm.
  • Ferramentas forenses extraem o original fácil. Qualquer parser PDF lista todos os content-streams de texto. O retângulo é só um desenho à parte.

Pra situações em que o texto subjacente realmente precisa sumir — publicações sob lei de transparência, provas em juízo, tudo que vai pro adversário — precisa de outro workflow: reexportar o documento fonte com o texto sensível apagado, ou converter a página em imagem e re-OCR (o que remove permanentemente a camada de texto).

O que sobrevive e o que não

  • O conteúdo visível das páginas fica igual. Tudo que não bateu fica exatamente como estava — mesmas fontes, mesma diagramação, mesmas imagens.
  • Marcadores, anotações, links, campos de formulário — tudo sobrevive. Os retângulos são adições desenhadas; nada mais é reconstruído.
  • O texto original é preservado embaixo. Ver seção acima. É a limitação central.
  • Assinaturas digitais ficam inválidas. Qualquer modificação no documento, incluindo adicionar retângulos, quebra o vínculo da assinatura.
  • PDFs criptografados precisam ser destrancados primeiro. Passa pelo unlock-pdf com a senha antes de tarjar.

Se algo parecer estranho

  • «At least one redaction pattern required». A lista de padrões estava vazia. Digite pelo menos uma palavra ou frase.
  • O padrão bateu mas cobriu mais texto do que o esperado. O PDF guardou aquela linha como um único fragmento, e o retângulo é por fragmento. Geralmente aceitável; se é problema, precisa reexportar a fonte com o texto removido direitinho.
  • O padrão não bateu com o que eu esperava. Três causas comuns: (1) o texto tá numa imagem escaneada, não em camada de texto — a ferramenta não vê texto em imagem; OCR primeiro via pdf-to-txt ou ferramenta dedicada. (2) O padrão cruza fragmentos — divide em mais curtos. (3) O PDF usa caracteres não latinos com encoding quebrado; copiar-colar do visualizador pra ver o que tem ali de fato é o diagnóstico mais rápido.
  • Eu tarjei mas um colega extraiu o texto via copiar-colar. Funcionando como documentado — só tarjeamento visual. Pra remoção real, reexporte da fonte.

Notas práticas

  1. Use pra esconder visualmente, não pra cenários adversariais. Esconder um nome num rascunho mandado pro amigo que não vai extrair: ok. Esconder um nome numa peça judicial onde a parte contrária vai rodar ferramentas forenses: não ok.
  2. Padrões específicos antes de genéricos. Tarjeie +55-11-555-0123, não 0123. Tarjeie [email protected], não jane. Padrões específicos cobrem demais menos e escondem igualmente o que você queria.
  3. Verifique copiando. Depois de tarjar, abre o resultado num visualizador, seleciona a área tarjada, copia. Se sair o texto original, você confirmou a limitação — continue só se esconder visualmente bastar.
  4. Pra remoção duradoura, use a fonte. Se o documento veio do Word, edita o Word e reexporta. De um banco, re-consulta sem os campos sensíveis. A ferramenta de tarjeamento PDF é pra casos em que não tem fonte.
  5. O arquivo original fica intacto. O que você baixa é um PDF tarjado novo; a fonte em disco não muda.

O que acontece com seu arquivo

O tarjeamento roda no seu navegador. Os padrões digitados e o conteúdo do arquivo nunca saem dessa aba. Abra o DevTools e veja a aba Network durante a operação — nenhuma requisição saindo com conteúdo do arquivo ou padrões. O PDF fica no disco; a versão tarjada é um download novo ao lado.

FAQ

Perguntas frequentes

Toda ocorrência será redigida?

Sim — varremos cada página e cobrimos toda correspondência de cada padrão informado. Não há modo \"só primeira ocorrência\"; a redação é global por design.

É redação nível forense?

Não. Nosso MVP pinta retângulos opacos sobre cada correspondência — visualmente está redigido, mas o texto subjacente continua no fluxo do PDF. Para redação forense (texto totalmente removido do arquivo, não apenas oculto), use um software de desktop como Adobe Acrobat Pro. Somos transparentes sobre essa troca para você decidir.

Então por que redação visual?

Para a maior parte dos casos — compartilhar um contrato modelo, esconder um telefone em um screenshot, apagar nomes num portfólio — a redação visual basta e é muito mais rápida que abrir o Acrobat. Só não use para documentos onde a outra parte vai extrair o texto.

Posso redigir uma região específica em vez de texto?

Redação por seleção de região (arrastar um retângulo na página) está no roadmap. A versão atual é \"digitar para encontrar\", ótima para e-mails, nomes, telefones e qualquer padrão baseado em texto.

Para onde vai meu arquivo?

Para lugar nenhum. A redação acontece inteiramente nesta aba. Verificável em DevTools → Network: não há upload.