TEXTERKENNUNG: WAS UNTERSCHEIDET OCR UND ICR?

Sabine Fach

05.09.2022

Use Case

Die Digitalisierung im Backoffice von Unternehmen fängt bei der Texterkennung an. In vielen Firmen kommen Rechnungen, Lieferscheine, Anträge und andere Unterlagen in Papierform ins Haus. Damit die Informationen aus diesen Belegen und Dokumenten in der Datenverarbeitung genutzt werden können, müssen sie manuell erfasst und ins System eingegeben werden. Texterkennungssoftware, bekannt als OCR (Optical Character Recognition, optische Zeichenerkennung) beschleunigt diesen aufwendigen und fehleranfälligen Prozess. Sie wandelt die Informationen aus papierbasierten eingescannten Dokumenten in maschinenlesbare Informationen um. In dieser Form können sie allen Abteilungen für die Weiterverarbeitung bereitgestellt, für Auswertungen genutzt und archiviert werden.

WIE FUNKTIONIERT OCR?

Bei genauerer Betrachtung ist der Begriff „Texterkennung“ für OCR ein bisschen übertrieben. Eigentlich geht es um die Erkennung einzelner Zeichen oder Buchstaben, und davon hat das Verfahren auch seine Bezeichnung. Das funktioniert folgendermaßen: Beim Einscannen oder digitalen Fotografieren von Papierdokumenten werden sogenannte Rastergrafiken erstellt. Auf diesen werden keine Buchstaben erkannt, sondern, in Zeilen und Spalten angeordnet, lediglich das Vorhandensein oder Nicht-Vorhandensein von Farbpunkten. Die Farbpunkte bilden Muster, und diese werden mit Mustern in einer Datenbank verglichen, damit sie als Buchstabe, Zahl, Satzzeichen interpretiert werden können.

Das Verfahren ist fehleranfällig, denn die Ähnlichkeit von Zeichen führt zu Verwechslungen bei der Interpretation, dazu beeinflussen Äußerlichkeiten des Originaldokumentes wie ein unsauberer Ausdruck, Knicke im Papier, Verschmutzungen etc. die Erkennbarkeit der Muster und damit ihre Zuordnung zu den Datenbank-Mustern. Anfangs war die Fehleranfälligkeit von OCR so hoch, dass sogar spezielle Schriftarten entwickelt wurden, deren Zeichen keinesfalls miteinander verwechselt werden können. So sollten Fehler in sensiblen Bereichen wie dem Zahlungsverkehr möglichst ausgeschlossen werden. Wenn in anderen Anwendungsbereichen die Interpretation als „2ahlung“, „8estellung“ oder „Stomierung“ erscheint, muss manuell nachgearbeitet werden, damit man zum korrekten Ergebnis „Zahlung“, „Bestellung“ oder „Stornierung“ kommt. 

WAS MACHT ICR ANDERS?

Im Lauf der Entwicklung von OCR wurden Bearbeitungsschritte auf der Ebene der Pixel und der Mustererkennung deutlich verbessert. Aber erst mit ICR (Intelligent Character Recognition, Intelligente Zeichenerkennung), der Weiterentwicklung von OCR unter Nutzung von KI, erreicht die Erkennung eine neue Dimension. Auf der Ebene der Zeichen lotet ICR gewissermaßen den Interpretationsspielraum der Muster aus und prüft, ob ein Muster beispielsweise als „8“ oder „B“, „6“ oder „b“, „m“ oder rn“ gelesen werden muss. Dafür bezieht das Verfahren die Umgebung des Zeichens ein und betrachtet die ganze Zeichengruppe und klärt die Interpretation unter anderem mithilfe statistischer Verfahren – wie häufig kommt ein Zeichen im Zusammenhang der umgebenden Zeichen vor –, aber auch Referenzmustern oder Wörterbüchern. Ausgegeben wird das Zeichen, das das System als höchstwahrscheinlich fehlerfrei bewertet; gegebenenfalls verändert es die Parameter und prüft Muster und Zeichen erneut. 

Durch die kontextbezogene Interpretation erreicht ICR höchstmögliche Fehlerfreiheit bei der Erkennung von Zeichen und schafft damit die Grundlage für die Weiterverarbeitung und Auswertung der Informationen nahezu ohne die Notwendigkeit menschlicher Eingriffe.

de_DEDeutsch

JETZT DEMO ANFORDERN.

*Pflichtfeld
Mit dem Absenden meiner Daten stimme ich der Verwendung dieser gemäß unserer Datenschutzerklärung zur Kontaktierung durch die Michael Bauner Consulting Services zu.

Michael Bauner
Consulting Services

JETZT TESTZUGANG ANFORDERN.

*Pflichtfeld
Mit dem Absenden meiner Daten stimme ich der Verwendung dieser gemäß unserer Datenschutzerklärung zur Kontaktierung durch die Michael Bauner Consulting Services zu.

Michael Bauner
Consulting Services

Forgotten password?

api DOCS

Instructions how to use our API.

live test

Test the powerful LAIGO sIDP live.

security standard

How LAIGO secures your data.

contact

Any questions? We have the answers.

about us

The spirit behind LAIGO.

GET YOUR CUSTOM AI.