Ablauf der OCR bzw. optischen Erkennung

Optical Character Recognition gliedert sich meist in die Arbeitsschritte: Scannen, Layout-Analyse, Segmentierung, Zeichenerkennung (Muster- und Merkmalserkennung) und Wörterbuchabgleich. Allerdings verwischen bei modernen Systemen immer mehr die Grenzen zwischen diesen Vorgängen und es werden,  je nach Anbieter, unterschiedliche innovative Verfahren zur Ergänzung herangezogen. 

Dieser Artikel umfasst folgende Seiten:


OCR Arbeitschritte

Scannen
Die Ergebnisse der OCR-Erkennung liefern nur Aussagen über Wahrscheinlichkeiten für bestimmte Buchstaben und keine absoluten Ergebnisse. Weitere Techniken der Texterkennung, wie z.B. Intelligent Character Recognition (ICR), können diese Wahrscheinlichkeiten in Frage stellen oder bestärken. Mittels Vorwissen, z.B. über die Sprache in der ein Dokument vorliegt, kann ICR eine intelligente Analyse vornehmen und Wörter innerhalb ihres Kontexts sehen.

Layout-Analyse
Die Layout-Analyse ist wichtig, um in komplexen Dokumenten mit mehrspaltigem Text, Tabellen und eingebetteten Grafiken den Aufbau berücksichtigen zu können. Sie unterscheidet automatisch zwischen Text und Bildern und kann den Textfluss im Dokument erkennen. So wird sichergestellt, dass die Textabschnitte auch in der richtigen Reihenfolge erkannt und dargestellt werden. Eine gute Analyse kann die Dokumentenstruktur fast originalgetreu wiedergeben und z.B. in HTML, PDF oder DOC speichern.

Segmentierung
Beim Arbeitsgang Segmentierung wird das Textabbild in Zeilen- und die Zeilen in Zeichen bzw. Ligaturen (Buchstaben, die sich berühren) aufgeteilt, so dass die Zeichen anschließend mit Mustererkennung und Merkmalserkennung erkannt werden können.

Merkmalserkennung
Die Merkmalserkennung findet heute in den meisten OCR-Programmen Anwendung. Sie dient der Klassifizierung von Zeichen. Es werden Zeichen in geometrische Elemente wie Bögen, Linien und Kreise zerlegt. Die Kombination dieser Elemente wird mit abgespeicherten Kombinationen bekannter Zeichen verglichen. Die Mustererkennung ist dieser Methode um einiges unterlegen und kommt deshalb nur noch unwesentlich zum Einsatz, da sie nicht mit Variationen der Schriftgröße und Schriftart zu Recht kommt.

OCR/ICR im Kontext mit anderen Systemen

In Kombination mit Dokumentenscannern und Dokumentenmanagement System (DMS) oder Information Lifecycle Management (ILM) können die durch  OCR und ICR möglichen Produktivitätssteigerungen erreicht werden.

Zu den bekanntesten OCR- Software-Anbietern gehört ABBYYs mit der FineReader Serie und Nuance mit dem Programm OmniPage. Darüber hinaus gibt es Bemühungen mit der Tesseract OCR-Engine, welche in den Achtziger Jahren von HP entwickelt wurde und nun von Google weiterentwickelt wird, eine OpenSource Software zu etablieren. Bisher ist diese Variante allerdings noch sehr unausgereift.

Weitere Seiten dieses Beitrags: 1 | 2

Noch Fragen: Stelle Sie diese doch einfach im Forum!
Tagcloud: DMS
Neues im DMS Forum
Neues im DMS Forum
ECM News RSS