In der Informatik , Markup - Sprachen stellen eine Klasse von Sprachen in der Anreicherung von Textinformationen spezialisiert. Sie verwenden Tags , syntaktische Einheiten, die eine Zeichenfolge abgrenzen oder eine genaue Position innerhalb eines Zeichenstroms markieren (z. B. eine Textdatei ).
Durch die Aufnahme von Tags werden sowohl die Struktur des Dokuments als auch dessen Inhalt übertragen. Diese Struktur kann von einem Computerprogramm verstanden werden , das eine automatisierte Verarbeitung des Inhalts ermöglicht.
Das Hauptmerkmal von Markup-Sprachen ist die Verwendung von Tags. Die Rolle von Tags besteht darin, eine Syntax zum Abgrenzen einer Zeichenfolge oder zum Markieren einer genauen Position in einem Zeichenstrom bereitzustellen.
Ein Beispiel in LaTeX- Sprache :
Je nach Sprache können die Tags unterschiedlich sein. In der LaTeX-Sprache beginnen sie mit einem Backslash .
In XML-Derivaten markieren Tags den Anfang und das Ende von "Elementen". Sie bestehen aus Unicode- Zeichen, die von den Zeichen <und umgeben sind >. Somit <table>sind <vidéo>und <B#3>syntaktisch gültige Tags in XML .
Tags am Ende von Elementen haben einen Schrägstrich nach dem unteren Vorzeichen ( </table>).
Es gibt auch leere Tags, die durch einen Schrägstrich vor dem übergeordneten Zeichen ( <br/>) gekennzeichnet sind.
Abhängig von der Sprache können andere syntaktische Besonderheiten von Tags vorhanden sein, z. B. Attribute, Optionen usw.
Tags sind nur ein syntaktisches Merkmal der Sprache. Die Sprachen, die sie verwenden, können daher von der Programmierung bis zur Dokumentanmerkung mehrfach verwendet werden.
In der Vergangenheit wurden tagbasierte Sprachen hauptsächlich zum Strukturieren oder Formatieren von Dokumenten verwendet.
Aufgrund ihrer syntaktischen Spezifität bei der Verwendung von Tags erleichtern diese Sprachen das Kommentieren von Text. Es reicht aus, Textteile mit Tags zu umgeben, um eine Sprachfunktion zu verwenden. Zum Beispiel in HTML, genügt es , ein Wort mit den Tags zu umgeben <b>und </b>so , dass es in erscheint fett .
Ein einfacher Texteditor reicht also aus, um ein Dokument zu definieren.
Zu den beliebtesten Dokumentdefinitionssprachen gehören DocBook- , LaTeX- , HTML- oder TEI- Derivate .
Diese speziellen Sprachen werden verwendet, um Klassen gültiger Dokumente nach einer bestimmten Anzahl von Kriterien zu definieren. Diese Kriterien können jedoch manchmal auch mit Tags ausgedrückt werden.
Mit DTDs können Sie beispielsweise Klassen von SGML- oder XML- Dokumenten definieren . Die DTD legt die Struktur der Dokumente fest, die sie respektieren. Eine DTD verwendet Tags, um anzugeben, welche Elemente und Attribute zulässig sind.
Die XML-Schemas sind eine weitere Möglichkeit, XML-Dokumentklassen zu definieren. Da sie selbst eine Klasse von XML-Dokumenten bilden, verwenden sie offensichtlich XML-Tags.
In diesen Sprachen sind die im Text eingebetteten Tags Anweisungen für das Programm, das den Text "liest".
Daher enthält die TeX- Sprache Anweisungen zur Dokumentformatierung in Form von Tags. Mit dem Tag \vsizekönnen Sie beispielsweise die Höhe der anzuzeigenden Seite angeben.
Mit dem Aufkommen von XML haben sich die Tools zur Verarbeitung von XML-Dokumenten erheblich weiterentwickelt. Daher war es selbstverständlich, XML selbst zu verwenden, um andere XML-basierte Sprachen zu definieren. Diese Sichtweise hat zu vielen Markup-Sprachen (weil sie auf XML basieren) und zu sehr heterogenen Verwendungen geführt. Anwendungsbeispiele:
In der Vergangenheit sind Anwendungen, die von SGML abgeleitet sind , die am häufigsten verwendeten Auszeichnungssprachen im Web .
HTML-SpracheDie am häufigsten verwendete Auszeichnungssprache im World Wide Web ist HTML . In HTML werden vordefinierte Tags verwendet, um innerhalb einer Textdatei Elemente wie Titel, Absätze, Akronyme , Anführungszeichen usw. anzugeben .
Blockelemente und Inline-ElementeWir unterscheiden die Tags, die einen Block definieren, von Inline-Tags durch:
„Stylesheets bieten die Möglichkeit, das Rendern beliebiger Elemente festzulegen, einschließlich der Frage, ob das Element als Blocktyp oder Inline-Typ gerendert wird. ""
Alle Anführungszeichen stammen aus der HTML- Standardspezifikation .
Beispiel <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>Wir begrenzen den Satz „Lorem ipsum dolor sit amet, consectetuer adipiscing elit. »Durch das Tag p(Definieren eines Absatzes) mittels eines öffnenden Tags ( <p>) und eines schließenden Tags ( </p>). Dieser Satz ist im Element enthalten p, das notwendigerweise selbst im Element enthalten ist body(dieses Element definiert den Anfang des Hauptteils der HTML-Datei).
Andere SGML-SprachenDas XML erweitert die semantische Beschreibung einer Datei weit, um sie genau zu definieren, beispielsweise in einem Rezept, dem <ingrédients>, dem <temps-de-cuisson>, dem <plats-nécessaires>usw. Um ein auf diese Weise geschriebenes XML-Dokument auszunutzen, verwenden wir XSLT- Blätter , mit denen ein XML-Dokument in einen anderen XML-Dokumenttyp umgewandelt werden kann.
Diese Freiheit bei der Auswahl von Tags ermöglicht es jedoch, eine Datei in XML zu schreiben, ohne semantische Informationen abzugrenzen: Außerhalb des Kontexts bedeutet das Tag <hy>nichts, es sei denn, es definiert seine Bedeutung in einer Definitionsdatei namens DTD , die dem XML zugeordnet ist Datei.
Microsoft und The Document Foundation verwenden für einige Office-Dateiformate ein XML-Format. Das .odt-Suffix von LibreOffice verbirgt beispielsweise eine Baumstruktur von komprimierten XML-Dateien .
Alle von XML abgeleiteten Sprachen, sogenannte XML-Dialekte, sind Auszeichnungssprachen.