Was ist OCR?
- OCR ist die Abkürzung für "optical character recognition" und bedeutet im Deutschen so viel wie "optische Zeichenerkennung". Diese Bezeichnung stammt aus dem Bereich der Informationstechnik und beschreibt automatisierte Texterkennungen.
- Der Vorgang besteht darin, zuerst Textblöcke von Grafiken zu unterscheiden, dann eine Zeilenstruktur zu erkennen und im Anschluss einzelne Zeichen bzw. Buchstaben zu identifizieren.
- Es wurden spezielle Schriftarten dafür entworfen: OCR-A und OCR-B. Diese dienten dazu, dass ein Computer schnell und ohne großen Aufwand die Zeichen in Buchstaben umsetzen konnte. Die zuerst entwickelte Schriftart OCR-A war im Gegensatz zur gut lesbaren OCR-B dem Alphabet sehr unähnlich. Durch die rasante Entwicklung von Computern und Eingabegeräten können heutzutage herkömmliche Druckerschriftarten und auch Handschriften verwendet werden.
Wofür werden diese Codes benötigt?
- Da Eingabegeräte, wie beispielsweise Faxgeräte oder Scanner, Buchstaben nicht als Buchstaben erkennen, sondern vielmehr als Grafiken mit verschieden angeordneten Pixeln, sind OCR-Codes vonnöten.
- Die Codes sollen also in erster Linie von Eingabegeräten erkannt werden, jedoch ist hier der große Unterschied zu anderen Verschlüsselungen, wie z. B. Strichcodes, dass Sie als Mensch diese Codes auch lesen und entschlüsseln können. Ein weiteres Gerät zum Abscannen des Codes ist hierzu nicht notwendig.
Das bedeutet, Sie kommen fast täglich mit OCR-Codes in Berührung, ohne es oft zu wissen. Denn dieses Verfahren wird immer verwendet, wenn Text auf einem anderen Eingabegerät weiterverarbeitet werden soll.
Weiterlesen:
Wie hilfreich finden Sie diesen Artikel?