Extraia texto de qualquer PDF,
no seu navegador.
Obtenha uma camada de texto limpa de qualquer PDF — parágrafos preservados, múltiplas páginas, UTF-8. A extração roda dentro do seu navegador, então o arquivo nunca sai do seu dispositivo.
Três passos. Seu PDF nunca sai desta aba.
Solte seu PDF
Escolha o arquivo do qual quer extrair texto. Ele é carregado na memória do navegador, não em um servidor.
Lemos a camada de texto
O pdf.js percorre cada página, ordena os itens pela coordenada Y e reconstrói as quebras de parágrafo onde devem ficar.
Copie ou baixe .txt
Receba texto puro UTF-8 limpo. Copie para a área de transferência ou salve como .txt — você decide.
Perguntas frequentes
Como funciona a extração?
Usamos o pdf.js da Mozilla para ler a camada de texto incorporada do seu PDF, página por página. Os itens são agrupados pela coordenada Y para que as quebras de parágrafo sejam preservadas — sem servidor, sem upload.
Funciona em PDFs digitalizados?
Não. Digitalizações são imagens de texto, não texto — extraí-las exige OCR, que esta ferramenta não executa. Se seu PDF veio de papel digitalizado, você precisará primeiro de uma ferramenta de OCR.
Meu arquivo é enviado para algum lugar?
Nunca. A extração roda inteiramente no seu navegador via WebAssembly — verificável em DevTools → Network. O arquivo permanece no seu dispositivo.
E PDFs protegidos por senha?
Desbloqueie o PDF primeiro com nossa ferramenta Desbloquear PDF, depois extraia. Fluxos de conteúdo criptografados não podem ser lidos sem a senha.
Qual é o limite de tamanho?
Até 100 MB. Acima disso pode esgotar a memória do navegador — tente dividir o PDF antes com a ferramenta Dividir PDF.