PDF para Texto

Extraia texto de qualquer PDF,
no seu navegador.

Obtenha uma camada de texto limpa de qualquer PDF — parágrafos preservados, várias páginas, UTF-8. A extração corre dentro do seu navegador, por isso o ficheiro nunca sai do seu dispositivo.

Largue o PDF do qual deseja extrair texto
Lemos a camada de texto incorporada com pdf.js — sem OCR, sem servidor.
Várias páginas · Saída UTF-8 PDFs digitalizados precisam de OCR — esta ferramenta lê apenas a camada de texto
Grátis
Sem registo
Sem upload
Saída UTF-8
COMO FUNCIONA

Três passos. O seu PDF nunca sai deste separador.

1

Largue o seu PDF

Escolha o ficheiro do qual quer extrair texto. É carregado para a memória do navegador, não para um servidor.

2

Lemos a camada de texto

O pdf.js percorre cada página, ordena os elementos pela coordenada Y e reconstrói as quebras de parágrafo no sítio certo.

3

Copie ou descarregue .txt

Receba texto puro UTF-8 limpo. Copie para a área de transferência ou guarde como .txt — você decide.

FAQ

Perguntas frequentes

Como funciona a extração?

Usamos o pdf.js da Mozilla para ler a camada de texto incorporada do seu PDF página a página. Os elementos são agrupados pela coordenada Y para que as quebras de parágrafo se mantenham — sem servidor, sem upload.

Funciona em PDFs digitalizados?

Não. As digitalizações são imagens de texto, não texto — extraí-las requer OCR, que esta ferramenta não executa. Se o seu PDF veio de papel digitalizado, precisa primeiro de uma ferramenta de OCR.

O meu ficheiro é enviado para algum lado?

Nunca. A extração corre inteiramente no seu navegador via WebAssembly — verificável em DevTools → Network. O ficheiro permanece no seu dispositivo.

E PDFs protegidos por palavra-passe?

Desbloqueie o PDF primeiro com a nossa ferramenta Desbloquear PDF e depois extraia. Streams de conteúdo encriptados não podem ser lidos sem a palavra-passe.

Qual é o limite de tamanho?

Até 100 MB. Acima disso pode esgotar a memória do navegador — divida primeiro com a ferramenta Dividir PDF.