Einführung

Oft ist es notwendig, Daten aus Messungen, Berechnungen, Umfragen oder ähnlichen Vorgängen abzuspeichern, um sie zu einem späteren Zeitpunkt wieder verwenden zu können. Meistens müssen dabei unterschiedliche Arten von Daten (z.B. Koordinaten eines Messortes und der zugehörigen Messwert) in einer Datei gespeichert werden.

In diesem Abschnitt lernen Sie, wie Sie solche Daten strukturiert mit Hilfe der extensible markup Language (XML) in Dokumenten abspeichern können, so dass beim späteren Weiterverarbeiten der Computer automatisch unterschiedliche Datenarten (wie beispielsweise die Koordinaten und den Messwert) unterscheiden kann.

Dazu wird erklärt, wie ein solches XML-Dokument aufgebaut sein soll und wie die Daten im Einzelnen formatiert werden müssen, damit das Dokument dem XML-Standard entspricht.

Die eXtensible Markup Language (XML) ist eine Metasprache mit der Dokumententypen definiert werden können.

Metasprache bedeutet, dass XML eine Sprache ist, mit der eine andere Sprache (z.B. XHTML) definiert werden kann.

XML ist daher eine universelle Möglichkeit zur Datenspeicherung, da für jede Art von Information ein eigener, speziell angepasster Dokumententyp definiert werden kann.

XML ist gleichzeitig eine Auszeichnungssprache. Das bedeutet, dass XML Informationen (z.B. Texte oder Daten) mit Hilfe von so genannten Tags hervorhebt.

<vorname> Johannes </vorname>

XML-Dateien sind einfach lesbar, da kein Maschinencode (wie binäre Zeichen) sondern Klartext (also Buchstaben) abgespeichert wird. Außerdem werden XML-Dateien üblicherweise formatiert (beispielsweise mit Tabulatoren), um die Lesbarkeit weiter zu verbessern. Die Auszeichnung der Informationen mit Tags ermöglicht gleichzeitig dem Computer die Verarbeitung der Daten, da dieser die Art der Information anhand der Tags erkennen kann.

Definition von Dokumenttypen

Wenn es zum Austausch von XML-Dokumenten kommt ist es wichtig, dass beide Seiten sich an die selben Konventionen in Bezug auf die verwendeten Elemente (bzw. Struktur) halten. Diese Konventionen werden in einer Document Type Definition (DTD) festgelegt. Mit XML kann jeder Benutzer Dokumenttypen für seine spezielle Anwendung definieren, d.h. jeder kann neue Dokumentarten so erzeugen, wie er sie für seine Datenstruktur benötigt. Beispielsweise kann ein Ingenieur einen speziellen Dokumententyp für Berechnungsdaten erzeugen oder ein Betriebswirtschaftler einen speziellen Dokumententyp für die Daten einer Buchführung.

Um einen neuen Dokumententyp zu erzeugen werden in einer Dokumententypdefinition (DTD) alle Elementearten definiert, die in einem entsprechenden Dokument vorkommen dürfen.

Ein Element ist dabei eine Information, die von Tags umschlossen wird. Für die Definition einer Elementart wird in der DTD angegeben, welche Art von Information das Element beinhaltet (Zeichenkette, Zahlenwert, Wahrheitswert) und von welchem Tag diese Information umschlossen wird.

Hinweis: XML eignet sich insbesondere zur Beschreibung von baumartigen Datenstrukturen (siehe im GeDV Skript)