Einlesen von Informationen

Um Informationen, die in einem Dokument gespeichert sind, in einem Programm nutzen zu können, müssen sie in das Programm eingelesen werden.

Der Vorgang des Einlesens teilt sich dabei in einige Schritte, die sich klar trennen lassen, auf.
  • Zunächst wird die Datei geöffnet.
  • Anschließend wird der Inhalt der Datei als Zeichenfolge in das Programm eingelesen.
  • Danach wird die Zeichenfolge in Abschnitte unterteilt, die nur noch eine Information enthalten.
  • Die Informationen in den einzelnen Abschnitten müssen nun analysiert werden. Es muss dazu der Typ der Information (Ist die Information eine Zahl oder eine Zeichenkette ?) erkannt und die Art der Information (Ist die Zeichenkette der Vorname, der Nachname oder der Wohnort einer Person ?) identifiziert werden.
  • Als letztes werden die Informationen in Strukturen innerhalb des Programms (meistens sind dies Variablen oder die Attribute von Objekten) entsprechend der Analyse zwischengespeichert. Beispielsweise wird die als Vorname erkannte Zeichenkette im Attribut "Vorname" in einem Objekt vom Typ "Person" gespeichert.

Diese unterschiedlichen Aufgaben werden meistens von einzelnen Funktionen bearbeitet. Eine Ausnahme sind die beiden letzten Punkte (Analyse und Zwischenspeichern), da diese Aufgaben meist eng miteinander verknüpft sind. Die Aufteilung in mehrere Funktionen macht die Verarbeitung der Daten flexibler und vereinfacht das Programmieren, da nicht alle Aufgaben auf einmal bedacht werden müssen.

Die Tätigkeit, die die oben genannten Punkte umfaßt, wird parsen genannt. Eine Funktion oder eine Zusammenstellung von Funktionen, die diese Tätigkeiten ausführen, nennt man Parser.