XML/Regeln/XML-Deklaration
Ein XML-Dokument besteht aus dem Prolog, einem Wurzel-Element und beliebig vielen Kommentaren, Verarbeitungsanweisungen (PIs, Processing Instructions) und Trennzeichen (space, Carriage Return, Line feed, Tab).
Jede XML-Datei sollte mit einer Auszeichnung beginnen, die den Bezug zu XML herstellt. Dazu dient die XML-Deklaration am Beginn der Datei.
<?xml version="1.0"?>
<!-- restliche XML-Datei folgt ab hier -->
Die XML-Deklaration ist also eine besondere, alleinstehende Auszeichnung, deren erstes und letztes Zeichen innerhalb der spitzen Klammern <
und >
ein Fragezeichen ?
ist. Unmittelbar hinter dem Anfangsfragezeichen muss xml
(kleingeschrieben) stehen. Dahinter können in Form von Attributen verschiedene Angaben folgen. Die Angabe der XML-Versionsnummer ist obligatorisch und deshalb auch in der einfachen Variante erforderlich. "Versionsnummer" bezieht sich dabei auf die Version der Sprachspezifikation von XML. Derzeit ist die Version 1.0 von XML maßgeblich. Es gibt zwar bereits eine Version 1.1, doch die gegenwärtigen XML-Parser unterstützen normalerweise nur die Version 1.0. Da das Konzept von XML syntaktisch weitgehend ausgereift ist, ist auch nicht mit einer Versionenflut zu rechnen. Benutzen Sie also außer in begründeten Ausnahmefällen die Angabe version="1.0".
Zusätzliche Angaben zur Zeichencodierung und zum DTD-Bezug
Neben der Versionsangabe kann die XML-Deklaration einer XML-Datei zwei weitere Attribute enthalten: eines zur verwendeten Zeichencodierung, und ein Ja/Nein-Attribut, ob die zugehörige DTD in der aktuellen Datei steht oder in einer separaten Datei.
<?xml version="1.0" encoding="utf-8" standalone="yes"?>
Mit dem Attribut encoding
geben Sie an, welche Zeichencodierung Sie zum Speichern der XML-Datei verwenden. Folgende Angaben sollte jeder XML-Parser kennen:
Anweisung | Bedeutung | Hinweis |
---|---|---|
encoding="UTF-8" | internationaler Codierung auf Basis der ISO/IEC-10646-Norm mit mindestens 8 Bit Zeichenbreite | |
encoding="UTF-16" | internationale Codierung auf Basis der ISO/IEC-10646-Norm mit mindestens 16 Bit Zeichenbreite | |
encoding="ISO-8859-1" | ISO-Codierung für westeuropäische Sprachen | ISO-8859-1 |
encoding="ISO-8859-2" | ISO-Codierung für osteuropäische Sprachen | ISO-8859-2 |
encoding="ISO-8859-3" | ISO-Codierung für südeuropäische Sprachen | ISO-8859-3 |
encoding="ISO-8859-4" | ISO-Codierung für nordeuropäische Sprachen | ISO-8859-4 |
encoding="ISO-8859-5" | ISO-Codierung für kyrillische Sprachen | ISO-8859-5 |
encoding="ISO-8859-6" | ISO-Codierung für arabische Sprachen | ISO-8859-6 |
encoding="ISO-8859-7" | ISO-Codierung für griechische Sprache | ISO-8859-7 |
encoding="ISO-8859-8" | ISO-Codierung für hebräische Sprache | ISO-8859-8 |
encoding="ISO-8859-9" | ISO-Codierung für türkische Sprache | ISO-8859-9 |
encoding="ISO-8859-10" | ISO-Codierung für nordische Sprache | ISO-8859-10 |
Wenn Sie keine Angaben zur Codierung der XML-Datei machen, wird per Voreinstellung UTF-8 angenommen.
Mit dem Attribut standalone
können Sie dem XML-Parser vorab mitteilen, ob die vorliegende Datei sich auf eine externe DTD bezieht oder nicht. Mit standalone="yes"
geben Sie an, dass sich die DTD innerhalb der aktuellen Datei befindet. Mit standalone="no"
teilen Sie mit, dass sich die DTD in einer separaten Datei befindet. Die Quelle müssen Sie in diesem Fall mit Hilfe der Dokumenttyp-Deklaration angeben.
Verarbeitungsanweisungen innerhalb einer XML-Datei
Hin und wieder kann es notwendig sein, dass auch innerhalb der XML-Datei spezielle Anweisungen für die auslesende Software notiert werden müssen. Solche Anweisungen nennt man Verarbeitungsanweisungen (processing instructions).
<?xml version="1.0"?>
<!-- Daten -->
<?xml-stylesheet type="text/css" href="styles.css"?>
<!-- Daten -->
<?PLZprozessor alertBox("es sind ungültige Postleitzahlen angegeben")?>
<!-- Daten -->
Die Verarbeitungsanweisung ist ein alleinstehendes Tag, dessen erstes und letztes Zeichen innerhalb der spitzen Klammern <
und >
ein Fragezeichen ?
ist. Unmittelbar hinter dem Anfangsfragezeichen folgt ein symbolischer Name derjenigen Software, an die sich die Verarbeitungsanweisung richtet. Die auslesende Software muss diesen symbolischen Namen natürlich kennen und wissen, dass die Verarbeitungsanweisung an sie gerichtet ist. Das Beispiel zeigt zwei typische Verarbeitungsanweisungen innerhalb der XML-Daten. Mit xml-stylesheet
wird beispielsweise ein Browser angesprochen, der die XML-Daten anzeigen soll und durch die entsprechende Verarbeitungsanweisung erfährt, wo die Stylesheet-Datei abgelegt ist, in der die Formatdefinitionen für die XML-Elemente dieser Datei notiert sind. Die zweite Verarbeitungsanweisung innerhalb der XML-Daten im Beispiel ist eine Phantasie-Anweisung, die zeigen soll, dass Verarbeitungsanweisungen ganz verschiedener Natur sein können.
<?xml-stylesheet?>
.Hauptartikel: SVG/Tutorials/Standalone-SVGs#externe Stylesheets nachladen