Extrayez le texte de tout PDF,
dans votre navigateur.
Récupérez une couche de texte propre depuis n'importe quel PDF — paragraphes préservés, multipage, UTF-8. L'extraction s'exécute dans votre navigateur, donc le fichier ne quitte jamais votre appareil.
Trois étapes. Votre PDF ne quitte jamais cet onglet.
Déposez votre PDF
Choisissez le fichier dont vous voulez extraire le texte. Il se charge dans la mémoire du navigateur, pas sur un serveur.
Nous lisons la couche de texte
pdf.js parcourt chaque page, trie les éléments par coordonnée Y et reconstitue les sauts de paragraphe à leur place.
Copier ou télécharger .txt
Obtenez du texte brut UTF-8 propre. Copiez-le dans le presse-papiers ou enregistrez-le en .txt — c'est vous qui décidez.
Questions fréquentes
Comment fonctionne l'extraction ?
Nous utilisons pdf.js de Mozilla pour lire la couche de texte intégrée à votre PDF, page par page. Les éléments sont regroupés par coordonnée Y afin que les sauts de paragraphe soient préservés — sans serveur, sans téléversement.
Cela fonctionne-t-il sur les PDF scannés ?
Non. Les scans sont des images de texte, pas du texte — leur extraction nécessite l'OCR, que cet outil n'exécute pas. Si votre PDF provient d'un papier scanné, il vous faudra d'abord un outil OCR.
Mon fichier est-il téléversé quelque part ?
Jamais. L'extraction s'exécute entièrement dans votre navigateur via WebAssembly — vérifiable dans DevTools → Network. Le fichier reste sur votre appareil.
Et les PDF protégés par mot de passe ?
Déverrouillez d'abord le PDF avec notre outil Déverrouiller PDF, puis extrayez. Les flux de contenu chiffrés ne peuvent pas être analysés sans le mot de passe.
Quelle est la limite de taille ?
Jusqu'à 100 Mo. Au-delà, la mémoire du navigateur peut être saturée — essayez d'abord de le diviser avec l'outil Diviser PDF.