Codes in gescannten PDFs finden & zählen — selbst auf fleckigen oder markierten Seiten
Echte Dokumente sind chaotisch: Kaffeeflecken, Textmarker, Faxstreifen, blasse Fotokopien. Unsere OCR wurde genau dafür gebaut — sie liest die Codes trotzdem, findet und zählt sie für Sie.
Die meisten Suchwerkzeuge setzen ein sauberes, perfektes Dokument voraus. Die Realität sieht anders aus. Die Rechnung, die Sie prüfen müssen, hat einen Stempel über einem Teil. Das Frachtmanifest ist dreimal durch ein Faxgerät gelaufen. Die Teileliste ist eine Fotokopie zehnter Generation mit Tonerstreifen. Ein normales Strg+F öffnet diese nicht einmal — es sind gescannte Bilder ohne Text. Und selbst die OCR großer PDF-Tools gibt bei unvollkommenen Seiten oft auf.
Die OCR-Suche von PDF Everyday wurde rund um chaotische, echte Dokumente entwickelt — die Art, die sich in Buchhaltung, Logistik und Einkauf stapelt. So funktioniert sie und das können Sie damit tun.
Wie die OCR eine beschädigte Seite liest
- Bildvorverarbeitung. Jede Seite wird in Graustufen umgewandelt, der Kontrast verstärkt und geschärft. Das macht blasse Fotokopien dunkler, trennt Text von Hintergrundflecken und rettet Zeichen, die ein roher Scan verschmieren würde.
- Optische Zeichenerkennung. Das bereinigte Bild wird von einer OCR-Engine gelesen, die Buchstaben und Ziffern aus ihren Formen rekonstruiert — so wie Sie ein Wort trotz Kaffeerand noch lesen können.
- Intelligente Normalisierung. Der erkannte Text wird so normalisiert, dass Satzzeichen, Abstände und typische Scan-Artefakte einen Treffer nicht blockieren.
Warum „intelligente Normalisierung" bei Codes wichtig ist
Dieselbe Teilenummer kann auf einem Dokument als 0450906508HWS und auf einem anderen als 0.450.906.508 HWS erscheinen — und der Scan fügt vielleicht einen Punkt hinzu oder verschmilzt ein Leerzeichen. Unsere Suche ignoriert Punkte, Bindestriche, Schrägstriche, Unterstriche und Leerzeichen in Codes, sodass all dies mit einer einzigen Suche übereinstimmt:
| Sie tippen | Es findet trotzdem |
|---|---|
| 0450906508HWS | 0.450.906.508 HWS · 0450 906 508 HWS |
| F026400683003 | F026-400-683-003 · F026 400 683 003 |
Sie müssen nicht wissen, wie der Code gedruckt wurde — Sie tippen einfach Ziffern und Buchstaben, den Rest erledigen OCR und Normalisierung.
🔍 Testen Sie es an Ihrem schwierigsten Dokument
Laden Sie ein fleckiges, gefaxtes oder fotokopiertes PDF hoch und suchen Sie einen Code. Treffer erscheinen Seite für Seite — kostenlos, ohne Anmeldung.
Gescanntes PDF durchsuchen →Was Sie damit tun können
1. Einen einzelnen Code sofort finden
Werfen Sie einen 200-seitigen Scan-Stapel hinein, tippen Sie die Rechnungs- oder Teilenummer und springen Sie direkt zur richtigen Seite.
2. Zählen, wie oft ein Code vorkommt
Die Suche liefert jede Seite, auf der ein Code vorkommt, sodass Sie Vorkommen im gesamten Dokument zählen können — nützlich, um Mengen zu prüfen oder zu bestätigen, dass ein Code nur dort erscheint, wo er soll.
3. Viele Codes gleichzeitig prüfen
Geben Sie bis zu 20 Codes durch Leerzeichen getrennt ein. Die Engine meldet, welche auf welchen Seiten gefunden wurden und welche fehlten — perfekt, um eine Liste mit einem Scan abzugleichen.
4. Dokumentübergreifend abgleichen
Lassen Sie dieselbe Codeliste über verschiedene Scans laufen, um zu bestätigen, dass ein Teil in Bestellung, Rechnung und Lieferschein erscheint — und Unstimmigkeiten zu erkennen.
Wer das nutzt
- Buchhalter — Rechnungsnummern in gescannten Büchern und Belegstapeln finden und zählen.
- Logistik & Zoll — Frachtbrief-, Container- und HS-Codes in gefaxten oder gescannten Versandpapieren finden.
- Einkauf & Lager — Teilenummern prüfen und Referenzen in gescannten Katalogen und Packlisten zählen.
- Versicherung & Recht — markierte, gestempelte oder kommentierte Scans nach Referenz- und Klausel-IDs durchsuchen.
Warum es Strg+F und den meisten Online-PDF-Tools überlegen ist
Strg+F funktioniert nur bei digitalem Text — in einem Scan findet es nichts. Die meisten beliebten Online-PDF-Suiten konzentrieren sich auf Zusammenführen und Konvertieren und haben entweder gar keine OCR-Suche oder bewältigen nur saubere Scans. PDF Everyday kombiniert aggressive Bildbereinigung, OCR und code-bewusste Normalisierung — damit es auch bei unvollkommenen Dokumenten weiter funktioniert.
Häufig gestellte Fragen
Kann es einen fleckigen oder markierten Scan wirklich lesen?
Ja. Seiten werden vor der OCR kontrastverstärkt und geschärft, was Text aus blassen Fotokopien, Faxstreifen und vielen Flecken rettet. Stark zerstörte Bereiche können scheitern, aber teilweise Markierungen und Schmierer verhindern einen Treffer meist nicht.
Kann ich zählen, wie oft ein Code vorkommt?
Ja. Die Suche listet jede Seite auf, auf der ein Code gefunden wird, sodass Sie Vorkommen im gesamten Dokument zählen können.
Wie viele Codes kann ich gleichzeitig suchen?
Bis zu 20 auf einmal, durch Leerzeichen getrennt. Sie sehen, welche wo gefunden wurden und welche nicht.
Spielt die Formatierung des Codes eine Rolle?
Nein. Punkte, Bindestriche, Schrägstriche und Leerzeichen in Codes werden ignoriert, sodass Sie das gedruckte Format nicht exakt treffen müssen.
Bleiben meine Dokumente privat?
Ja. Dateien werden im Speicher verarbeitet und sofort nach der Suche gelöscht — nichts wird gespeichert oder geteilt.