Optical Character Recognition

OCR - Optical Character Recognition
Optische Zeichenerkennung. Methode, mit der Textinformationen aus gescannten Schriftstücken erkannt werden können.

Die optische Zeichenerkennung spezifisch definierter Zahlen und Buchstaben (Character) arbeitet ebenfalls mit einer Zeichencodierung ähnlich dem Barcode. Doch in diesem Fall ist die Schrift von Schriftarten und nicht von Strichfolgen abhängig.

Schriftart - Font
Ein Zeichensatz spezieller Art und Größe graphischen Typs.

Da konventionelle Schriftarten nicht zwangsweise eine einfache optische Erkennung gewährleisten, wurden computernahe Schriften definiert.

Ursprünglich gab es dazu eigene OCR-Schriften, z.B. für das Bedrucken von Scheckformularen. OCR-A und OCR-B sind - wie ihre Namen schon zum Ausdruck bringen - für die optische Zeichenerkennung entwickelt worden. Die OCR-A-Schrift mit ausgeprägten vertikalen Balken erscheint als stark stilisiert und ist maschinell generierbar. Die OCR-B-Schrift hingegen entspricht gewissen ästhetischen Ansprüchen. Ihr Gesamtbild ist runder und gleicht deshalb stärker den bekannten Leseschriften.

Der Vorteil bei OCR ist, dass die Informationen sowohl von Menschen stammen, als auch von Maschinen gelesen werden können. OCR ist eine zweidimensionale Technologie: Ein OCR-Scanner untersucht Zeichen sowohl horizontal wie auch vertikal während des Decodierungsprozesses.

In den meisten Anwendungen geht die Aufgabe der Schrifterkennung deutlich weiter als das Erkennen der einzelnen Buchstaben. Heute können alle gedruckten Texte erkannt werden. Hinter diesem Prozess verbergen sich Konturanalysen für Zeichen, Expertensysteme, mathematische Berechnungen und Wörterbücher. Das Programm analysiert die Zeichen und bildet eine erste Hypothese zu dem gebildeten Wort. Das wird mit dem vorhandenen Wörterbuch verglichen und bei Übereinstimmungen als richtig erkannt. Eine hundertprozentige Zeichenerkennung ist trotz der großen Fortschritte bei OCR nicht möglich und jedes Dokument bedarf der genauen Kontrolle.

Barcode.OpticalCharacterRecognitionOCR by Katrin Reiher at 12.03.2007 16:25

Servicebereich:

Autorenkontakt, PDFs der Vorlesungsfolien und des Skripts, off-line CD, Links, das Glossar uvm.

weiter...

Alle Bilder zum Thema:Barcode

weiter...

Die gesamte Literaturliste

weiter...

Übungsfragen:Barcode

weiter...

Glossar der Identifikation

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Abkürzungen