Conversor PDF para
Word
Converta PDF em documentos Word editáveis. Disposição e tabelas preservadas — o documento nunca sai do navegador.
Verifique você mesmo: abra o DevTools → separador Network → solte um ficheiro. Veja zero envios a acontecer.
Três passos. Zero envios.
Largue o PDF
Carregue o ficheiro na memória do navegador.
Converta no navegador
Texto, tabelas e formatação são extraídos localmente.
Descarregue o DOCX
Abra no Word ou num editor à escolha. O PDF original permanece intacto.
Quando convém converter um PDF em Word
O motivo mais comum: precisa editar o documento e tudo o que tem é o PDF. Alguém enviou um contrato, um relatório ou uma nota interna, e os pontos a alterar estão espalhados pelo documento — corrigir um erro, atualizar datas, substituir um parágrafo pela versão correta. Fazê-lo num editor de PDF é possível, mas se houver muito texto a reescrever, abrir o ficheiro no Word é mais rápido e cómodo.
Outros motivos frequentes: extrair parágrafos para colar noutro documento; copiar uma secção para o corpo de um email; reformatar um CV que chegou em PDF para uma vaga diferente; reaproveitar partes de um artigo. Sempre que precisa de tirar texto do PDF e pô-lo em algo editável, é esta a conversão certa.
O que esta conversão consegue recuperar e o que não
A ferramenta extrai o texto do PDF e reconstrói-o num documento Word. O que isso significa na prática depende muito do que o PDF é, na verdade.
- Os PDFs baseados em texto convertem bem. Se o PDF foi feito por exportação a partir do Word, com um «Guardar como PDF» de qualquer aplicação, ou por um sistema que o produziu diretamente (uma ferramenta de faturação, um gerador de relatórios), o texto no PDF é mesmo texto — e a ferramenta lê-o limpo. O Word resultante tem parágrafos selecionáveis e editáveis.
- Os PDFs digitalizados só voltam em parágrafos se tiverem camada OCR. Uma digitalização pura sem OCR é apenas uma imagem das páginas — não há texto para extrair. Se o PDF foi digitalizado mas já com OCR aplicado (muitos scanners modernos e serviços na nuvem adicionam essa camada automaticamente), a ferramenta lê-a e produz texto. Se for uma digitalização crua sem OCR, sairá um Word vazio ou quase. Nesse caso passe o PDF primeiro por uma ferramenta de OCR.
- A reconstrução do layout é boa para prosa, pior para layouts complexos. A ferramenta deteta corpo de texto e cabeçalhos analisando tamanhos de tipo de letra e agrupando texto por linhas. Para um documento normal — parágrafos, cabeçalhos, listas, tabelas simples — funciona bem. Para layouts em várias colunas, notas de rodapé à volta de imagens, caixas laterais com texto a fluir, o resultado coloca o texto numa ordem aproximadamente correta, mas não no layout original.
- As imagens não são atualmente extraídas para o Word. A ferramenta foca-se no texto. Se o PDF tem fotos, gráficos ou diagramas que também precisa no Word, terá de extraí-los à parte (abrir o PDF, capturar a imagem, colar no Word) ou usar outra via de conversão.
E a formatação
A ferramenta tenta preservar aquilo que passa de forma fiável:
- Cabeçalhos versus corpo de texto são inferidos do tamanho do tipo de letra — texto sensivelmente maior do que o corpo é marcado como cabeçalho no Word.
- Quebras de parágrafo são detetadas pelo espaçamento entre linhas, pelo que os parágrafos no Word correspondem aos do PDF.
- Os tamanhos de tipo de letra são preservados a grosso modo ao nível de troço — texto a 14pt no PDF fica em torno de 14pt no Word.
O que é mais difícil, e porquê:
- Negrito e itálico exigem que o PDF use efetivamente um tipo de letra negrito ou itálico (não um regular que o motor de renderização desenhou um pouco mais grosso). Muitos PDFs codificam isto corretamente; outros não.
- Tabelas com células fundidas complexas ou tabelas aninhadas costumam achatar-se em parágrafos lineares. Tabelas simples passam melhor que as elaboradas.
- Os tipos de letra originais são referenciados quando possível, mas se o seu computador não os tem, o Word substituirá pelos seus. O conteúdo está correto; o aspeto pode diferir.
Notas práticas
- Se o PDF tiver palavra-passe, desbloqueie-o primeiro. Passe-o por unlock-pdf antes da conversão — PDFs cifrados não abrem para extrair texto.
- Para PDFs longos a conversão demora. Um documento de 200 páginas precisa de ser analisado página a página, as linhas agrupadas em parágrafos e o .docx montado. Num portátil típico conte com cerca de um minuto. Tenha paciência na primeira execução.
- O ciclo é com perdas. Se pegar num Word, converte-lo para PDF (com uma ferramenta que cristaliza o layout em imagem) e depois esse PDF de volta a Word — o segundo Word será bem mais áspero que o primeiro. O .docx original, se ainda existir, será sempre mais limpo. Esta ferramenta é para os casos em que o original já não está disponível.
- Se só precisar do texto, não de um Word, veja pdf-to-txt. É mais rápido e dá-lhe texto simples para colar onde quiser.
O que acontece ao seu ficheiro
O seu PDF é carregado para a memória do navegador, é aí analisado quanto a texto e layout, e convertido em .docx localmente. O Word resultante é-lhe oferecido como descarga; nada é carregado, nenhum servidor processa o seu documento. Pode confirmá-lo: abra as DevTools, observe o separador Network durante a conversão — não verá pedidos a sair com o conteúdo do seu ficheiro.
Perguntas frequentes
O meu PDF é enviado para um servidor?
Não. A conversão é feita inteiramente no seu navegador. O ficheiro não sai do dispositivo.
Preserva tabelas e formatação?
Sim. Tabelas, listas, títulos e a maior parte da formatação de parágrafo transitam para o DOCX. Disposições complexas podem deslocar-se ligeiramente.
Os PDFs digitalizados convertem (OCR)?
PDFs digitalizados precisam de OCR para se tornarem texto editável. PDFs nativos (exportados do Word, InDesign, etc.) convertem sem problemas.
Lida com disposições complexas?
Colunas, notas de rodapé e caixas de texto são aproximadas. Para correspondência perfeita, compare sempre o DOCX com a fonte após a conversão.