Extraia texto de qualquer PDF,
no seu navegador.
Obtenha uma camada de texto limpa de qualquer PDF — parágrafos preservados, várias páginas, UTF-8. A extração corre dentro do seu navegador, por isso o ficheiro nunca sai do seu dispositivo.
Três passos. O seu PDF nunca sai deste separador.
Largue o seu PDF
Escolha o ficheiro do qual quer extrair texto. É carregado para a memória do navegador, não para um servidor.
Lemos a camada de texto
O pdf.js percorre cada página, ordena os elementos pela coordenada Y e reconstrói as quebras de parágrafo no sítio certo.
Copie ou descarregue .txt
Receba texto puro UTF-8 limpo. Copie para a área de transferência ou guarde como .txt — você decide.
Perguntas frequentes
Como funciona a extração?
Usamos o pdf.js da Mozilla para ler a camada de texto incorporada do seu PDF página a página. Os elementos são agrupados pela coordenada Y para que as quebras de parágrafo se mantenham — sem servidor, sem upload.
Funciona em PDFs digitalizados?
Não. As digitalizações são imagens de texto, não texto — extraí-las requer OCR, que esta ferramenta não executa. Se o seu PDF veio de papel digitalizado, precisa primeiro de uma ferramenta de OCR.
O meu ficheiro é enviado para algum lado?
Nunca. A extração corre inteiramente no seu navegador via WebAssembly — verificável em DevTools → Network. O ficheiro permanece no seu dispositivo.
E PDFs protegidos por palavra-passe?
Desbloqueie o PDF primeiro com a nossa ferramenta Desbloquear PDF e depois extraia. Streams de conteúdo encriptados não podem ser lidos sem a palavra-passe.
Qual é o limite de tamanho?
Até 100 MB. Acima disso pode esgotar a memória do navegador — divida primeiro com a ferramenta Dividir PDF.