Trouver & compter des codes dans un PDF scanné — même sur des pages tachées ou annotées
Les vrais documents sont désordonnés : taches de café, surligneur, lignes de fax, photocopies pâles. Notre OCR a été conçu pour cela — il lit les codes malgré tout, puis les trouve et les compte pour vous.
La plupart des outils de recherche supposent un document propre et parfait. La réalité est différente. La facture à vérifier a un tampon sur une partie. Le manifeste d'expédition est passé trois fois par un fax. La liste de pièces est une photocopie de dixième génération striée de toner. Un simple Ctrl+F ne les ouvre même pas — ce sont des images scannées sans texte. Et même l'OCR des grands outils PDF abandonne souvent sur des pages imparfaites.
La recherche OCR de PDF Everyday a été pensée pour les documents réels et désordonnés — ceux qui s'accumulent en comptabilité, logistique et achats. Voici comment elle fonctionne et ce que vous pouvez en faire.
Comment l'OCR lit une page abîmée
- Prétraitement de l'image. Chaque page est convertie en niveaux de gris, son contraste est renforcé puis l'image est accentuée. Cela assombrit les photocopies pâles, sépare le texte des taches et récupère les caractères qu'un scan brut fusionnerait.
- Reconnaissance optique de caractères. L'image nettoyée est lue par un moteur OCR qui reconstruit lettres et chiffres à partir de leurs formes — comme vous lisez encore un mot malgré une auréole de café.
- Normalisation intelligente. Le texte reconnu est normalisé pour que la ponctuation, les espaces et les artefacts de scan courants ne bloquent pas une correspondance.
Pourquoi la « normalisation intelligente » compte pour les codes
Une même référence peut apparaître 0450906508HWS sur un document et 0.450.906.508 HWS sur un autre — et le scan peut ajouter un point ou fusionner un espace. Notre recherche ignore points, tirets, barres obliques, tirets bas et espaces dans les codes, si bien que tout cela correspond à une seule recherche :
| Vous tapez | Il trouve quand même |
|---|---|
| 0450906508HWS | 0.450.906.508 HWS · 0450 906 508 HWS |
| F026400683003 | F026-400-683-003 · F026 400 683 003 |
Pas besoin de savoir comment le code a été imprimé — vous tapez les chiffres et les lettres, l'OCR et la normalisation font le reste.
🔍 Essayez sur votre document le plus difficile
Importez un PDF taché, faxé ou photocopié et recherchez un code. Les résultats apparaissent page par page — gratuit, sans inscription.
Rechercher dans un PDF scanné →Ce que vous pouvez en faire
1. Trouver un code instantanément
Déposez un lot scanné de 200 pages, tapez le numéro de facture ou de pièce et accédez directement à la bonne page.
2. Compter les occurrences d'un code
La recherche renvoie chaque page où un code apparaît, ce qui permet de compter ses occurrences dans tout le document — utile pour vérifier des quantités ou confirmer qu'un code n'apparaît qu'où il le doit.
3. Vérifier plusieurs codes à la fois
Saisissez jusqu'à 20 codes séparés par des espaces. Le moteur indique lesquels ont été trouvés et sur quelles pages, et lesquels manquaient — parfait pour rapprocher une liste d'un document scanné.
4. Recouper plusieurs documents
Lancez la même liste de codes sur différents scans pour confirmer qu'une pièce figure dans la commande, la facture et le bon de livraison — et repérer les écarts.
Qui l'utilise
- Comptables — localiser et compter des numéros de facture dans des registres et lots de reçus scannés.
- Logistique & douane — trouver les numéros de lettre de voiture, conteneur et codes SH dans des documents faxés ou scannés.
- Achats & entrepôt — vérifier des références et compter les occurrences dans des catalogues et listes de colisage scannés.
- Assurance & juridique — rechercher des identifiants et numéros de clause dans des scans annotés ou tamponnés.
Pourquoi c'est mieux que Ctrl+F et la plupart des outils PDF en ligne
Ctrl+F ne fonctionne que sur du texte numérique — il ne trouve rien dans un scan. La plupart des suites PDF en ligne se concentrent sur la fusion et la conversion et n'ont pas de recherche OCR, ou ne gèrent que des scans propres. PDF Everyday combine un nettoyage d'image agressif, l'OCR et une normalisation adaptée aux codes pour continuer à fonctionner même quand le document est loin d'être parfait.
Questions fréquentes
Peut-il vraiment lire un scan taché ou annoté ?
Oui. Les pages sont contrastées et accentuées avant l'OCR, ce qui récupère le texte des photocopies pâles, des lignes de fax et de nombreuses taches. Les zones très détériorées peuvent échouer, mais les marques partielles n'empêchent généralement pas une correspondance.
Puis-je compter les occurrences d'un code ?
Oui. La recherche liste chaque page où un code est trouvé, ce qui permet de compter ses occurrences dans tout le document.
Combien de codes puis-je rechercher à la fois ?
Jusqu'à 20 à la fois, séparés par des espaces. Vous voyez lesquels ont été trouvés et où, et lesquels non.
Le format du code a-t-il de l'importance ?
Non. Les points, tirets, barres obliques et espaces dans les codes sont ignorés ; inutile de reproduire le format imprimé exact.
Mes documents restent-ils privés ?
Oui. Les fichiers sont traités en mémoire et supprimés immédiatement après la recherche — rien n'est stocké ni partagé.