Optical Character Recognition (OCR)

Die "Optical Character Recognition" (OCR) erlaubt es, gedruckte Texte, wie Briefe, Zeitungen und Bücher, welche von Scannern digitalisiert wurden, derart zu analysieren, dass sie mit großer Wahrscheinlichkeit in korrekt lesbare, digitale Textdateien (ASCII) verwandelt werden können. Diese können dann vom Computer für die Weiterverarbeitung genutzt werden.

Dieser Artikel umfasst folgende Seiten:


Intelligent Character Recognition (ICR)

Aufbauend auf diese digitalen Textdateien (ASCII), ergänzt die "Intelligent Character Recognition" (ICR) die OCR, indem sie die Plausibilität der OCR-Ergebnisse, mit Hilfe vorher festgelegter Regeln, prüft. Diese Regeln basieren meist auf linguistischen Grundlagen oder gleichen die Daten mit hinterlegten Wörterbüchern ab. Hiermit können auch schwierige handschriftliche Fragebögen und Formulare in editierbare und indexierbare Daten umgewandelt werden.

Im angelsächsische Sprachraum wird der Begriff "ICR" für die elektronische Texterkennung verwendet, im deutschsprachigen Umfeld hingegen findet  "OCR" als Synonym Verwendung. Tatsächlich handelt es sich jedoch um unterschiedliche Teilbereiche der Texterkennung.

Weitere Seiten dieses Beitrags: 1 | 2

Noch Fragen: Stelle Sie diese doch einfach im Dokumentenmanagement Forum!