Extrae texto de cualquier PDF,
en tu navegador.
Obtén una capa de texto limpia de cualquier PDF — con párrafos preservados, multipágina, UTF-8. La extracción se ejecuta dentro de tu navegador, así que el archivo nunca sale de tu dispositivo.
Tres pasos. Tu PDF nunca sale de esta pestaña.
Suelta tu PDF
Elige el archivo del que quieres extraer texto. Se carga en la memoria del navegador, no en un servidor.
Leemos la capa de texto
pdf.js recorre cada página, ordena los elementos por coordenada Y y reconstruye los saltos de párrafo donde corresponden.
Copia o descarga .txt
Obtén texto plano UTF-8 limpio. Cópialo al portapapeles o guárdalo como .txt — tú decides.
Preguntas frecuentes
¿Cómo funciona la extracción?
Usamos pdf.js de Mozilla para leer la capa de texto incrustada de tu PDF página a página. Los elementos se agrupan por coordenada Y para que los saltos de párrafo se mantengan — sin servidor, sin subida.
¿Funciona con PDF escaneados?
No. Los escaneados son imágenes de texto, no texto — extraerlos requiere OCR, que esta herramienta no ejecuta. Si tu PDF proviene de papel escaneado, primero necesitarás una herramienta OCR.
¿Se sube mi archivo a algún sitio?
Nunca. La extracción se ejecuta enteramente en tu navegador con WebAssembly — verificable en DevTools → Network. El archivo se queda en tu dispositivo.
¿Y los PDF protegidos por contraseña?
Desbloquea el PDF primero con nuestra herramienta Desbloquear PDF, y luego extrae. Los flujos de contenido cifrados no se pueden parsear sin la contraseña.
¿Cuál es el límite de tamaño?
Hasta 100 MB. Tamaños mayores pueden agotar la memoria del navegador — divídelo antes con la herramienta Dividir PDF.