Caviarder du texte dans un PDF
dans votre navigateur.
Tapez les mots à masquer — chaque occurrence sur chaque page est couverte. Sans envoi, sans fuite. (Caviardage visuel, pas niveau forensique — voir FAQ.)
Vérifiez par vous-même : ouvrez DevTools → onglet Network → déposez un fichier. Constatez zéro upload.
Trois étapes. Votre fichier ne quitte jamais cet onglet.
Déposez votre PDF
Choisissez le fichier à caviarder. Il est chargé dans la mémoire du navigateur, pas sur un serveur.
Tapez les motifs
Noms, e-mails, téléphones — un par ligne ou séparés par des virgules. Nous trouvons chaque occurrence.
Téléchargez la copie caviardée
Chaque correspondance est couverte d'un rectangle noir opaque sur chaque page. L'original reste intact.
Couvrir un texte que vous ne voulez pas partager
Les raisons de caviarder un PDF tiennent généralement à cacher des parties d'un document tout en laissant le reste lisible. Un contrat avec l'adresse personnelle d'une contrepartie part chez un troisième relecteur qui ne devrait pas voir cette adresse. Une orientation médicale est partagée avec un assureur où l'identifiant patient doit être masqué. Un état financier est joint à un dossier de conseil mais les numéros de comptes au niveau unité doivent être couverts. Une proposition de projet est montrée à des prestataires candidats avec la ligne de budget noircie pour qu'ils proposent sans s'ancrer sur le chiffre. La tâche ici est petite et prévisible : tapez les mots ou phrases à masquer, l'outil dessine un rectangle noir opaque sur chaque occurrence sur chaque page.
Lisez ceci attentivement avant de caviarder quoi que ce soit de sensible : il s'agit d'une censure visuelle, non forensique. Les rectangles noirs couvrent le texte à l'écran et à l'impression, mais le texte sous-jacent reste dans le fichier. Quiconque dispose d'un outil PDF peut l'extraire par copier-coller, recherche ou inspection du content-stream. C'est approprié quand des lecteurs de passage ne doivent pas voir le texte — envoi d'un brouillon, masquage de numéros de comptes non publics à un collègue, masquage de votre numéro de téléphone sur une capture. Ce n'est pas approprié pour des publications au titre de la transparence, des dépôts judiciaires, ou tout ce qu'un adversaire examinera de près.
Comment fonctionne la correspondance
Vous saisissez un ou plusieurs motifs. Chaque motif est cherché en correspondance whole-substring insensible à la casse contre les fragments de texte à l'intérieur du PDF. Quand un fragment contient votre motif, un rectangle noir est dessiné par-dessus tout le bounding-rect du fragment.
Conséquences pratiques :
- Correspondance par sous-chaîne, pas par mot entier. Le motif
artcouvre « art », « artist », « smart », « martin ». Faites des motifs assez spécifiques — noms complets, numéros de comptes complets, e-mails complets. - Insensible à la casse. Le motif
Annacouvre « Anna », « anna », « ANNA ». - Pas de regex, pas de jokers. Ce que vous tapez est la séquence littérale à matcher.
- Couverture par fragment. Le PDF stocke le texte en fragments ; le bounding rect dessiné couvre tout un fragment. Si votre motif touche un mot dans un fragment qui contient plus de texte, le texte environnant sera couvert aussi. C'est généralement ce qu'on veut ; parfois on voit plus couvert que prévu.
- Les motifs traversant des frontières de fragments sont manqués. « Jean Dupont » est un fragment dans certains PDF et deux dans d'autres. S'il est éclaté, le motif ne matchera pas sur la chaîne reconstituée. Ajoutez les parties comme motifs séparés :
Jean Dupont,Dupont,Jean.
Le rectangle noir a 1 point de marge autour du bounding box détecté — pour le placement subpixel des glyphes, afin que des bandes du texte d'origine ne dépassent pas sur les bords.
Ce qui est caché vs. ce qui reste dans le fichier
Cette section compte plus que toute autre. Le rectangle noir est une instruction de dessin dans le content-stream de la page. Le texte d'origine est aussi dans le content-stream, en dessous. Les lecteurs PDF les affichent dans l'ordre : texte d'abord, puis rectangle au-dessus, donc le rectangle gagne visuellement. Mais le texte lui-même n'est pas supprimé.
Ce que cela veut dire concrètement :
- Le copier-coller récupère le texte d'origine. Sélectionner la zone caviardée dans Adobe Reader et copier donne les mots que vous vouliez cacher. Le rectangle noir n'est pas sélectionnable ; le texte en dessous l'est.
- Les moteurs de recherche trouvent le texte. Si le PDF caviardé est uploadé sur un site, une recherche du nom caviardé fera remonter le document.
- Ré-enregistrer dans un autre outil PDF peut conserver les deux couches. Certains outils reconstruisent le content-stream et pourraient supprimer les caviardages ; d'autres les gardent.
- Les outils forensiques extraient l'original facilement. N'importe quel parseur PDF peut lister tous les content-streams texte. Le rectangle est juste un dessin séparé.
Pour les situations où le texte sous-jacent doit vraiment partir — publications au titre de la transparence, preuves en justice, tout ce qui va à un adversaire — il faut un autre workflow : ré-exporter le document source avec le texte sensible supprimé, ou convertir la page en image et ré-OCR (ce qui retire définitivement la couche texte).
Ce qui survit et ce qui ne survit pas
- Le contenu visible des pages reste le même. Tout ce qui n'a pas matché reste exactement comme avant — mêmes polices, même mise en page, mêmes images.
- Signets, annotations, liens, champs de formulaire — tout survit. Les rectangles sont des ajouts dessinés ; rien d'autre n'est reconstruit.
- Le texte d'origine est conservé en dessous. Voir la section ci-dessus. C'est la limitation centrale.
- Les signatures numériques deviennent invalides. Toute modification du document, y compris ajouter des rectangles, rompt la liaison de la signature.
- Les PDF chiffrés doivent être déverrouillés d'abord. Passer par unlock-pdf avec le mot de passe avant de caviarder.
Si quelque chose paraît bizarre
- « At least one redaction pattern required ». La liste de motifs était vide. Tapez au moins un mot ou une phrase.
- Le motif a matché mais a couvert plus de texte que prévu. Le PDF a stocké cette ligne comme un seul fragment, et le rectangle est par fragment. Généralement acceptable ; si c'est un problème, il faut ré-exporter la source avec le texte correctement retiré.
- Le motif n'a pas matché ce que je voulais. Trois causes habituelles : (1) le texte est dans une image scannée, pas dans une couche texte — l'outil ne voit pas le texte image ; OCR d'abord via pdf-to-txt ou un outil dédié. (2) Le motif s'étale sur plusieurs fragments — découper en plus courts. (3) Le PDF utilise des caractères non latins avec un encodage cassé ; copier-coller depuis un visualiseur pour voir ce qu'il y a vraiment est le diagnostic le plus rapide.
- J'ai caviardé mais un collègue a extrait le texte par copier-coller. Fonctionne comme documenté — censure visuelle uniquement. Pour un retrait réel, ré-exporter depuis la source.
Notes pratiques
- Utilisez pour cacher visuellement, pas pour des scénarios adverses. Cacher un nom dans un brouillon envoyé à un ami qui n'essaiera pas d'extraire : ok. Cacher un nom dans un dépôt judiciaire où la partie adverse passera des outils forensiques : pas ok.
- Motifs spécifiques plutôt que génériques. Caviardez
+33-1-55-50-01-23, pas0123. Caviardez[email protected], pasjane. Les motifs spécifiques sur-couvrent moins et cachent autant ce qui est voulu. - Vérifiez en copiant. Après caviardage, ouvrir le résultat dans un visualiseur, sélectionner la zone caviardée, copier. Si le texte d'origine sort, vous avez confirmé la limitation — continuez seulement si la dissimulation visuelle suffit.
- Pour un retrait durable, utilisez la source. Si le document vient de Word, modifiez le Word et ré-exportez. S'il vient d'une base, re-requêtez sans les champs sensibles. L'outil de caviardage PDF est pour les cas sans accès à la source.
- Le fichier d'origine reste intact. Ce que vous téléchargez est un nouveau PDF caviardé ; la source sur le disque ne change pas.
Ce qui arrive à votre fichier
Le caviardage tourne dans votre navigateur. Les motifs tapés et le contenu du fichier ne quittent jamais cet onglet. Ouvrez DevTools et surveillez l'onglet Network pendant l'opération — aucune requête sortante avec le contenu du fichier ou les motifs. Le PDF reste sur le disque ; la version caviardée est un nouveau téléchargement à côté.
Questions fréquentes
Toutes les occurrences seront-elles caviardées ?
Oui — nous parcourons chaque page et couvrons chaque correspondance de chaque motif saisi. Pas de mode « première occurrence uniquement » ; le caviardage est global par conception.
Est-ce un caviardage de niveau forensique ?
Non. Notre MVP peint des rectangles opaques sur chaque correspondance — visuellement c\'est caviardé, mais le texte sous-jacent reste dans le flux du PDF. Pour un caviardage forensique (texte totalement supprimé du fichier, pas seulement masqué), utilisez un outil bureautique comme Adobe Acrobat Pro. Nous sommes transparents sur ce compromis.
Pourquoi un caviardage visuel alors ?
Pour la plupart des cas — partager un contrat-type, masquer un numéro sur une capture, effacer des noms dans un portfolio — le caviardage visuel suffit et est bien plus rapide que d\'ouvrir Acrobat. Évitez-le seulement pour les documents dont la partie adverse extraira le texte.
Puis-je caviarder une zone précise plutôt que du texte ?
Le caviardage par sélection de zone (tracer un rectangle sur la page) est au programme. La version actuelle est « recherche par texte », parfaite pour e-mails, noms, téléphones et tout motif de chaîne.
Où va mon fichier ?
Nulle part. Le caviardage a lieu entièrement dans cet onglet. Vérifiable dans DevTools → Network : aucun envoi.