Definition „Markup Language“ Was ist eine Auszeichnungssprache?

Von Gedeon Rauch

Ob HTML, XML oder YAML: Auszeichnungssprachen, im Englischen Markup Languages, machen durch ihre Formatierung Texte für Maschinen und Menschen lesbar. Eine Auszeichnungssprache benutzt hierfür spezielle Codices, die Formatierungen kenntlich machen.

Anbieter zum Thema

Markup Languages wie HTML sollen dafür sorgen, dass Menschen und Maschinen Daten und Dokumente gleichermaßen erfassen können.
Markup Languages wie HTML sollen dafür sorgen, dass Menschen und Maschinen Daten und Dokumente gleichermaßen erfassen können.
(Bild: Pankaj Patel / Unsplash)

Auszeichnungssprache ist ein Begriff, der ursprünglich aus dem klassischen Druck kommt und bereits dort eine klare Definition dessen lieferte, was wie gedruckt werden würde. Dies bezieht sich beispielsweise auf das Drucken von unterstrichenen oder kursiven Buchstaben, aber auch die Wahl von Schriftfarben und Schriftgrößen.

Eine Auszeichnungssprache in der IT bezeichnet im Kern nichts anderes, nur dass die Markup Language nun die Formatierung des Textes und anderer Medien im Digitalen übernimmt. Das wohl bekannteste Beispiel einer Auszeichnungssprache ist HTML (Hypertext Markup Language), die Grundlage des modernen Internets.

Warum eine Auszeichnungssprache in der IT?

Auszeichnungssprachen sind es, die Texten Struktur geben und den Unterschied zwischen einem lesbaren Text und einem chaotischen String machen. Inhalte müssen strukturiert dargestellt werden können und eine Auszeichnungssprache ist die perfekte Schnittstelle zwischen Autorinnen und Autoren, einer Maschine als Interface und den menschlichen Empfangspersonen.

Um Textblöcke sinnvoll und verständlich anzuordnen, müssen die Befehle einer Markup Language eingefügt werden, wodurch verschiedene Schrifteigenheiten genutzt werden können und ein echter Schriftsatz entsteht.

Die Anfänge der Auszeichnungssprachen

Der Begriff einer Auszeichnungssprache für digitale Formatierung wurde von William Tunnicliffe 1967 zum ersten Mal öffentlich gebraucht und prägt bis heute das Bild einer Markup Language, welche Inhalt durch Format besser verständlich macht.

1969 entwickelte IBM dann die erste Auszeichnungssprache GML (Generalized Markup Language), welche entwickelt wurde, um technische Dokumentationen darzustellen. GML wurde im Folgenden weiterentwickelt und 1986 standardisiert als SGML (Structured Generalized Markup Language). In der 1986 genutzten Form gehört SGML zu den wichtigsten Vorgängern von HTML und XML.

Zu den weiteren (historisch weniger relevanten) Auszeichnungssprachen gehören beispielsweise TeX oder Scribe. Scribe war die erste Auszeichnungssprache, die Text und Stildateien trennte und TeX wird auch heute noch genutzt – zur Darstellung mathematischer Formeln.

Wie funktionieren Textauszeichnungen?

In der Praxis funktioniert eine Auszeichnungssprache in der Regel recht einfach, indem sie Textauszeichnungen für bestimmte Abschnitte nutzt und damit den Syntax definiert. Dies geschieht durch Start und End Tags, welche als Anfangs- bzw. Endmarkierungen wie eine Klammer um Textabschnitte gelegt werden.

Markierungen dieser Art werden hierarchisch aufgebaut, es können also mehrere Markierungen übereinander „gestapelt“ werden. Ein Beispiel: Ein String Text kann sowohl eine Überschrift als auch kursiv und unterstrichen sein, ohne dass hierfür eine einzelne Markierung notwendig wäre. Es genügt, den Text als Überschrift und kursiv und unterstrichen zu markieren.

In einer Auszeichnungssprache und eine Auszeichnungssprache darstellen

Da HTML die derzeit wohl bekannteste Auszeichnungssprache ist, eignet die Hypertext Markup Language sich auch bestens für Beispiele. Der Text einer Website kann in einem HTML-Editor genau so geschrieben werden wie in einem Text-Editor. Letzteres setzt lediglich ein gewisses Verständnis der Begrifflichkeiten in HTML voraus, um einen für Browser fehlerfrei lesbaren Text schreiben zu können.

Ein normaler Textabschnitt wäre etwa durch den Start und End Tag „body“ gekennzeichnet, wobei der End Tag „/body“ durch den Front Slash kenntlich gemacht würde. In diesem Textkörper könnten einzelne Wörter dann hervorgehoben werden, etwa durch Fettschreibung und die entsprechenden Markierungen „strong“ und „/strong“. Jeder Browser kann die Befehle problemlos lesen und anpassen. So kann ein Fließtext problemlos mit Auflösung und Fenstergröße skalieren und auf verschiedenen Endgeräten dargestellt werden.

Höhere Abstraktionsebenen mit XML

Zu den derzeit am weitesten verbreiteten Markup Languages gehört XML. Die Extensible Markup Language kommt vor allem auch bei der App Entwicklung und im Web Development zum Einsatz und erweitert die klassische Auszeichnungssprache als Textformatierung, um höhere Abstraktionsebenen, auf denen auch verschiedene Medientypen dargestellt werden können.

Daher kommt XML nicht nur für Dokumente und in Textverarbeitungssoftware zum Einsatz, sondern ist auch die Grundlage für viele Datenbanken. Bei XML rückt die reine Textformatierung in den Hintergrund und der Aufbau wird durch den Einsatz unterschiedlicher Komponenten.

Datenserialisierung mit YAML

Eine weitere populäre, vereinfachte Auszeichnungssprache, die häufig der Speicherung der Laufzeitkonfiguration in Konfigurationsdateien dient, ist YAML (ursprünglich „Yet Another Markup Language“, mittlerweile „YAML Ain't Markup Language“). YAML wandelt Daten aus einer programminternen Form so um, dass sie sich als Textdatei abspeichern lassen. Die formatierten Daten sollen anschließend für Maschinen und Menschen gleichermaßen lesbar sein.

Inhalte lesbar machen

Auszeichnungssprachen gehören in der IT zu den Grundpfeilern des Informationsaustauschs. Alleine durch Auszeichnungssprachen ist es möglich, dass User Texte sinnvoll strukturiert lesen können. Moderne Markup Languages können dabei noch deutlich mehr und gehen über die reine Textformatierung hinaus. Statt reiner Formatierung wird in Medien und semantische Kennzeichen unterschieden.

Online-Shops etwa beinhalten unterschiedliche Formatierungen für Produktnamen, -nummern oder Preise, welche wiederum von der Website einfach im Backend in ein Formular übertragen werden können. Gleichzeitig lassen Markup Language sich in einem grafischen Frontend schreiben (wie etwa die meisten Content Management Systeme funktionieren), können aber auch im Backend in der Sprache selbst geschrieben werden.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Softwareentwicklung und DevOps

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

(ID:48091783)