Definition „Extensible Markup Language“ Was ist XML?

Autor / Redakteur: LineFeed / Stephan Augsten

Die Extensible Markup Language – oder kurz XML – bildet die Basis für viele Datenformate, darunter auch die Neudefinition von HTML. XML-Dokumente speichern Daten strukturiert, in gleichzeitig maschinen- und menschenlesbarer Form. Das Anwendungsspektrum ist breit.

Anbieter zum Thema

XML bildet die Basis für verschiedene Datenformate und deren Strukturierung.
XML bildet die Basis für verschiedene Datenformate und deren Strukturierung.
(© Vasilius - stock.adobe.com)

Ursprung und Entstehung von XML

XML steht für Extensible Markup Language oder auch Erweiterbare Auszeichnungssprache. Sie ist eine vereinfachte Neudefinition, aber auch eine Anwendung der Standard Generalized Markup Language SGML. Als Metasprache eignet sich XML dafür, neue Sprachen zu definieren. Ein prominentes Beispiel hierfür ist HTML. Versionen vor HTML5 sind als SGML-Anwendungen definiert.

XML sollte SGML in dieser Funktion ersetzen, daher hat das World Wide Web Consortium (W3C) die Sprache HTML unter dem Namen XHTML neu definiert. Diskrepanzen zwischen dem W3C und der Industrie führten zu einer unabhängigen und nachlässigeren Standardisierung durch die WHATWG, bekannt als HTML5. Obwohl XML dadurch seinen eigentlichen Zweck nicht erfüllt, spielt die Meta-Markup-Language in vielen anderen Anwendungsbereichen eine wichtige Rolle.

Was erbte XML von SGML?

Der größte Teil der XML-Sprachdefinition stammt unmittelbar aus SGML, die nach ISO 8879 genormt ist. Als einflussreiches Konzept erbt XML von SGML die Trennung von logischen und physischen Einheiten, von Struktur und Inhalt. Sie setzt sich mit der Aufteilung in HTML und CSS fort und bildet damit letztendlich auch die Grundlage für die gerätespezifische Darstellung von Webseiten, beispielsweise im Responsive Webdesign.

Die Flexibilität und Vielseitigkeit von XML und SGML beruht auf den vom Benutzer frei definierbaren Syntaxelementen und der Möglichkeit, diese in Form sogenannter Schemata zu speichern. Ein XML-Schema gibt die Struktur eines XML-Dokuments vor und definiert damit eine Sprache.

Die grundlegende Struktur von XML-Dokumenten

Ein XML-Dokument besteht aus Inhalt und Textauszeichnungen (engl. Markup). Auszeichnungen, die in spitze Klammern eingeschlossen sind, heißen Tags. Sie treten meist paarweise auf und schließen dann einen Inhalt ein. Tags und eingeschlossener Inhalt bilden ein Element.

Grundsätzlich inhaltslose Elemente bestehen nur aus einem einzigen Tag. Ein Beispiel ist der Zeilenumbruch <br /> in HTML. Hier ist zu erkennen, dass bei inhaltslosen Elementen vor der schließenden spitzen Klammer ein Schrägstrich steht. Dieser ist auch bei Elementen mit Inhalt zu finden, steht dort aber hinter der öffnenden spitzen Klammer des schließenden Tags, wie im folgenden Beispiel einer HTML-Absatzmarkierung zu erkennen ist: <p>Dies ist eine neuer Absatz, der gleich endet.</p>.

Der zweite elementare Sprachbaustein von SGML, neben dem Element, ist das Attribut. Attribute sind Namens-Wert-Paare, die innerhalb von öffnenden oder inhaltslosen Tags notiert werden. Ein prominentes Beispiel für die Verwendung von Attributen ist die Spezifikation der Dateinamen für Bilder, die mit dem einem Image-Tag wie <img src="Dev-Insider.gif"</img> in HTML Dokumente eingefügt werden.

Typische Anwendungsbereiche und Anwendungen von XML

Aufgrund ihrer Eigenschaften als Meta-Textauszeichnungssprache eignet sich XML für ein sehr breites Anwendungsspektrum. Besonders typisch ist der Einsatz im Internet – denn Webseiten sind nichts anderes als Dokumente – und in lokal vernetzten Computersystemen.

Die Anwendungsgebiete reichen von Sprachdefinitionen wie DocBook, die zur Erstellung formatierter und druckbarer Textdokumente dienen, über die Speicherung von Metadaten und Protokollen für die Netzwerkkommunikation bis hin zu Dateiformaten für die anwendungsspezifische Speicherung von Konfigurationsdaten sowie dem vektoriellen Bildformat SVG. Besonders prominente Beispiele sind:

  • Atom / RSS Syndication Frameworks
  • DocBook
  • grafische Benutzerschnittstellen: Glade, XForms, XUL
  • die Keyhole Markup Language (KML) für die Annotation digitaler Kartendienste
  • MathML
  • der RDF-Standard für die Speicherung von Metadaten, speziell im WWW
  • das XBEL-Format für die Speicherung von Bookmarks
  • das XSPF Playlist-Format

(ID:45175304)