Texterkenntnis: Was ist der Unterschied zwischen OCR und ICR?

Die Digitalisierung im Backoffice von Unternehmen beginnt mit der Texterkennung. In vielen Unternehmen gehen Rechnungen, Lieferscheine, Anträge und andere Dokumente in Papierform ein. Damit die Informationen aus diesen Belegen und Dokumenten in der Datenverarbeitung verwendet werden können, müssen sie manuell erfasst und in das System eingegeben werden. Texterkennungssoftware, bekannt als OCR (Optical Character Recognition), beschleunigt diesen mühsamen und fehleranfälligen Prozess. Sie wandelt die Informationen aus papierbasierten, gescannten Dokumenten in maschinenlesbare Informationen um. In dieser Form können sie allen Abteilungen zur weiteren Verarbeitung zur Verfügung gestellt, für Auswertungen genutzt und archiviert werden.

WIE FUNKTIONIERT OCR?

Bei genauerer Betrachtung ist der Begriff „Texterkennung“ für OCR etwas übertrieben. Tatsächlich geht es um die Erkennung einzelner Zeichen oder Buchstaben, und daher kommt auch der Name dieses Verfahrens. So funktioniert es: Wenn Papierdokumente gescannt oder digital fotografiert werden, entstehen sogenannte Rastergrafiken. Auf diesen werden keine Buchstaben erkannt, sondern nur das Vorhandensein oder Fehlen von Farbpunkten, die in Zeilen und Spalten angeordnet sind. Die Farbpunkte bilden Muster, die mit Mustern in einer Datenbank verglichen werden, sodass sie als Buchstaben, Zahlen und Satzzeichen interpretiert werden können.

Der Prozess ist fehleranfällig, da die Ähnlichkeit der Zeichen zu Verwechslungen bei der Interpretation führt. Darüber hinaus beeinflussen äußere Merkmale des Originaldokuments, wie z. B. ein unsauberer Ausdruck, Falten im Papier, Verschmutzungen usw., die Erkennbarkeit der Muster und damit deren Zuordnung zu den Mustern in der Datenbank. Anfänglich war die Fehleranfälligkeit der OCR so hoch, dass sogar spezielle Schriftarten entwickelt wurden, deren Zeichen unter keinen Umständen miteinander verwechselt werden konnten. Auf diese Weise sollten Fehler in sensiblen Bereichen wie dem Zahlungsverkehr so weit wie möglich ausgeschlossen werden. Wenn in anderen Anwendungsbereichen die Interpretation als „Zahlung“, „Bestellung“ oder „Stornierung“ erscheint, ist eine manuelle Nachbearbeitung erforderlich, um zum richtigen Ergebnis „Zahlung“, „Bestellung“ oder „Stornierung“ zu gelangen. 

WAS MACHT ICR ANDERS?

Mit der Weiterentwicklung der OCR haben sich die Verarbeitungsschritte auf Pixelebene und die Mustererkennung erheblich verbessert. Aber erst mit ICR (Intelligent Character Recognition), der Weiterentwicklung der OCR mithilfe von KI, erreicht die Erkennung eine neue Dimension. Auf Zeichenebene untersucht die ICR sozusagen den Spielraum für die Interpretation von Mustern und prüft, ob ein Muster beispielsweise als „8“ oder „B“, „6“ oder „b“, „m“ oder „rn“ gelesen werden soll. Dabei berücksichtigt das Verfahren die Umgebung des Zeichens und betrachtet die gesamte Zeichengruppe. Die Interpretation wird mit Hilfe statistischer Methoden – wie oft kommt ein Zeichen im Kontext der umgebenden Zeichen vor – aber auch Referenzmustern oder Wörterbüchern geklärt. Das Ergebnis ist das Zeichen, das das System als am wahrscheinlichsten fehlerfrei einstuft; gegebenenfalls ändert es die Parameter und überprüft das Muster und das Zeichen erneut. 

Durch kontextbezogene Interpretation erreicht ICR ein Höchstmaß an Genauigkeit bei der Erkennung von Zeichen und schafft damit die Grundlage für die weitere Verarbeitung und Auswertung der Informationen, nahezu ohne dass ein menschliches Eingreifen erforderlich ist.

Sie wollen eine Kosteneinschätzung Ihres Projekts?

Füllen Sie dazu einfach dieses Formular aus und wir melden uns schnellstmöglich bei Ihnen zurück

In-House KI von Laigo

*Pflichtfeld
Datenschutz ist uns sehr wichtig!
Die angegebenen Daten werden ausschließlich für den vorgesehenen Zweck verwendet. Erfahren Sie mehr über unser Engagement und Datenschutzerklärung

Auf der Suche nach KI-Superkräften?

Learn more about Laigo’s products and how they apply to your business!

Laigo dog Milo image.

*Pflichtfeld
Datenschutz ist uns sehr wichtig!
Die angegebenen Daten werden ausschließlich für den vorgesehenen Zweck verwendet. Erfahren Sie mehr über unser Engagement und Datenschutzerklärung