HTML/Tutorials/Element, Tag und Attribut
Text-Info
- 15min
- einfach
- Grundkenntnisse in
• Einstieg in HTML
HTML-Dateien bestehen aus dem normalen Text, den der Besucher der Webseite später sehen wird. Hinzu kommt der Code, der den Text semantisch (nach seiner Bedeutung) markiert, also definiert, was beispielsweise ein Absatz oder eine Überschrift ist.
Dieses Markup verwendet Klartext, also Zeichen aus dem normalen Zeichenvorrat und keine unsichtbaren Steuerzeichen wie Textverarbeitungsprogramme.
Inhaltsverzeichnis
Elemente und Tags[Bearbeiten]
Der Inhalt von HTML-Dateien wird mit HTML-Elementen ausgezeichnet. HTML-Elemente werden durch so genannte Tags (englisch für Etiketten) markiert. Fast alle HTML-Elemente werden durch ein einleitendes und ein abschließendes Tag markiert. Der Inhalt dazwischen ist der „Gültigkeitsbereich“ des entsprechenden Elements. Tags werden in spitzen Klammern notiert.
Das Beispiel zeigt eine Überschrift 1. Ordnung, die durch das h1-Element ausgezeichnet ist.
Das einleitende Tag <h1>
signalisiert, dass eine Überschrift 1. Ordnung folgt (h = heading = Überschrift). Das abschließende Tag </h1>
signalisiert das Ende der Überschrift. Ein abschließendes Tag beginnt mit einer öffnenden spitzen Klammer und einem Schrägstrich </
.
Verschachtelung von Elementen[Bearbeiten]
Elemente können ineinander verschachtelt werden. Auf diese Weise entsteht eine hierarchische Struktur. Komplexere HTML-Dateien enthalten sehr viele Verschachtelungen. Deshalb sprechen Fachleute auch von strukturiertem Markup.
<em>HTML</em> - die Sprache des Web
</h1>Mit dem Element em
wird ein Teil eines Fließtextes als betont (engl. emphasized) ausgezeichnet. Der Text zwischen <em>
und </em>
erhält in den meisten Browsern eine andere Darstellung, häufig kursiv.
inhaltsleere Elemente[Bearbeiten]
Es gibt auch einige Elemente mit „Standalone-Tags“. Dies sind leere Elemente, die keinen Inhalt haben und deshalb nur aus einem Tag bestehen statt aus Anfangs- und End-Tag.
Leere Elemente sind: area, base, br, col, embed, hr, img, input, link, meta, param, source, track, wbr
Falls solche Elemente Zusatzinformationen benötigen, wie beispielsweise im img
Element die URL des darzustellenden Bildes, können sie nur mit Hilfe von Attributen des Tags angegeben werden.
Innerhalb des Absatzes befindet sich ein img-Element. Da es selbst keinen Inhalt hat, sondern eine externe Grafik referenziert, benötigt es auch kein schließendes Tag.
Am Ende der zweiten Zeile signalisiert <br>
, dass ein manueller Zeilenumbruch eingefügt werden soll (br = break = Umbruch). Auch dieses Element hat nur ein Tag.
optionale Tags[Bearbeiten]
Es gibt in HTML einige optionale Tags, die im Markup weggelassen werden können. Sie werden dann vom Browser beim Parsen automatisch eingefügt.
Elemente mit optionalem Abschluss-Tag[Bearbeiten]
Bei einigen Elementen, z. B. p
oder li
, darf man das schließende Tag weglassen. Die Browser werden das schließende Tag ergänzen. Allerdings muss das nicht immer mit der Intention des Autors übereinstimmen.
br
oder img
.Elemente sind Pflicht, Tags sind optional[Bearbeiten]
Die Elemente html
, head
und body
sind auch bei HTML Pflicht und werden, wenn der HTML-Autor eines von ihnen weggelassen hat, vom Browser ergänzt. Dies ist übrigens keine neue Eigenschaft von HTML5, sondern galt auch schon für frühere HTML-Versionen.
<!doctype html>
<title>Dokument ohne html und head</title>
<h1>Überschrift</h1>
Man muss beim Aufschreiben und Weglassen von optionalen Tags auch keine konsistente Linie verfolgen. So ist es technisch korrekt, z. B. <html>
wegzulassen (d. h. vom Browser ergänzen zu lassen), aber trotzdem </html>
hinzuschreiben. Dies ist aber unnötig verwirrend und sollte vermieden werden.
Die traditionelle Empfehlung, die auch SELFHTML immer vertreten hat, lautet, alle optionalen Tags zu notieren. Der Vorteil ist, sofern man valides HTML schreibt, dass der HTML-Code dann immer mit der internen Repräsentation des Browsers übereinstimmt, wodurch die Wahrscheinlichkeit von Missverständnissen verringert wird. Außerdem können Sie natürlich einem Element ohne öffnendes Tag keine Attribute geben.
Der Google HTML/CSS Style Guide empfiehlt hingegen, alle optionalen Tags konsequent wegzulassen:
<!DOCTYPE html>
<meta charset="utf-8">
<title>Saving money, saving bytes</title>
<p>Qed.
Dies diene einem schnellen Überblick über das HTML und optimiere es gleich im Hinblick auf die Dateigröße. Andererseits werde es einige Zeit zur Umsetzung brauchen, weil es deutlich von dem abweiche, was Webentwickler typischerweise lernten (wie etwa bei SELFHTML).
Attribute in Tags[Bearbeiten]
Einleitende Tags und Standalone-Tags können zusätzliche Angaben in Form von Attributen und dazugehörenden Attributwerten enthalten. Neben Attributen, die nur in bestimmten HTML-Elementen vorkommen können, gibt es auch so genannte Universalattribute, die in allen HTML-Elementen erlaubt sind.
Es gibt folgende Arten von Attributen in HTML-Elementen:
- Attribute mit Zuweisung vorgegebener Werte,
z. B. bei<input type="text">
oder<input type="number">
,
einem Eingabefeld für einfachen Text oder Zahlen – hier sind nur bestimmte Werte erlaubt. - Attribute mit freier Wertzuweisung, wobei jedoch ein bestimmter Datentyp oder eine bestimmte Konvention erwartet wird,
z. B. bei<input type="number" maxlength="10">
– ein Eingabefeld, in das der Benutzer bis zu 10 Zeichen eingeben kann – hier wird eine numerische Angabe erwartet. - Attribute mit freier Wertzuweisung ohne weitere Konventionen, z. B.
<p title="Aussage mit Vorbehalt">
– hier kann ein beliebiger Text zugewiesen werden.
Das abbr-Tag enthält ein title-Attribut mit der Langform der Abkürzung.
Die zwei Textabsätze im Dokument enthalten ein id-Attribut, in denen sie eindeutige Bezeichner erhalten (, die z. B. über CSS formatiert werden können).
Durch die unterschiedlichen Werte der href
-Attribute zeigen die beiden Verweise auf unterschiedliche Ziele.
HTML5 verlangt Anführungszeichen nur, wenn im Attributwert " ' ` = < > sowie Leerzeichen enthalten sind.
Information: Namenskonventionen
Attributsnamen haben in HTML die Konvention
- in camelCase oder komplett klein geschrieben zu werden. Also topLeft oder topleft statt top_left
- es spielt (für HTML und CSS) aber keine Rolle, ob die Attributnamen in Klein- oder Großbuchstaben notiert werden. In JavaScript, das case-sensitiv ist, jedoch schon.
Es verringert die Wahrscheinlichkeit von Fehlern, wenn Sie grundsätzlich alle Werte, die Sie Attributen zuweisen, in einfache ' oder doppelte " Anführungszeichen setzen. Sie können diese zwei Arten innerhalb einer Datei beliebig mischen, lediglich für ein einzelnes Attribut müssen an Anfang und Ende dieselben Zeichen benutzt werden. Welches Zeichen Sie wählen, ist im Prinzip egal.
Information
Im Wiki gibt es oft Beispiele von inline-SVG in HTML5-Dokumenten. Hier sind alle SVG-Attribute klein geschrieben. Wenn Sie diese Codebeispiele aber in SVG-Dokumenten verwenden, müssen diese Attribute XML-konform geschrieben werden.
So wird das kleingeschriebene viewbox-Attribut in einem SVG-Dokument ignoriert, da es das viewBox-Attribut in case-sensitiver Schreibweise erwartet.
Boolesche Attribute[Bearbeiten]
Boolesche Attribute können nur zwei Zustände angeben: wahr oder falsch. Das heißt, dass sie entweder vorhanden sind (entspricht dem Zustand wahr) oder eben nicht (entspricht dem Zustand falsch). Bei XML-konformer Schreibweise muss ein Attributwert notiert werden, weshalb laut Spezifikation entweder der kanonische Name (also der Attributname selbst) in Kleinschreibweise notiert wird oder ein leerer Wert (siehe die letzten beiden video
-Elemente im folgenden Beispiel):
Kommentare[Bearbeiten]
HTML beinhaltet die Möglichkeit, an fast beliebigen Stellen innerhalb einer HTML-Datei Kommentare einzufügen. Diese werden vom Browser ignoriert, d. h. nicht angezeigt.
Kommentare sind z. B. sinnvoll,
- um interne Angaben zu Autor und Erstelldatum in einer Datei zu platzieren,
- um interne Anmerkungen zu bestimmten Textstellen zu machen oder
- Teile des Dokuments während der Entwicklung intern auszukommentieren.
Kommentare werden durch die Zeichenfolge <!--
eingeleitet. Dahinter folgt beliebig langer Kommentartext oder HTML-Markup, das aber nicht als HTML interpretiert wird.
Kommentare können überall dort notiert werden, wo man auch andere HTML-Elemente oder Text notieren könnte. Innerhalb der spitzen Klammern eines Tags ist ein Kommentar nicht erlaubt, bzw. innerhalb der Anführungszeichen eines Attributwertes oder in einem CDATA-Bereich wird er als normaler Textinhalt behandelt.
<h1>Willkommen!</h1>
<!-- einzeiliger Kommentar -->
<p>viel Text</p>
<!-- und das ist ein mehrzeiliger Kommentar
zu dem Text mit <p>...</p>
Letzte Zeile des Kommentars -->
--
den Kommentar beendet. Deshalb lassen sich HTML-Kommentare nicht schachteln. Ebenso ist damit die Zeichenfolge --
innerhalb eines Kommentars nicht erlaubt. Wenn Sie zur deutlichen Hervorhebung eines Kommentars Sonderzeichen als Trennlinie einsetzen wollen, dann können Sie eben nicht den Bindestrich -
verwenden, sondern müssen sich für irgendein anderes Zeichen, beispielsweise das Gleichheitszeichen =
oder das Sternchen *
, entscheiden.Früher wurden speziell gekennzeichnete Kommentare, sogenannte Conditional Comments, vom Internet Explorer als Browserweiche verwendet.
Einschränkungen bei HTML-Kommentaren[Bearbeiten]
Die HTML5-Spezifikation des W3C weist darauf hin, dass das öffnende <html>
-Tag nur dann weggelassen werden kann, wenn das erste, was sich im html
-Element befindet, kein HTML-Kommentar ist und dass das schließende </html>
-Tag weggelassen werden kann, wenn auf das html
-Element nicht direkt ein HTML-Kommentar folgt [1]. (Für die Elemente head
und body
gilt Entsprechendes.)
Diese Einschränkungen sind vielleicht verwirrend, da sie ein bisschen irreführend formuliert sind. Es ist nicht verboten, z. B. Folgendes zu schreiben:
<!doctype html>
<!-- Mein Kommentar -->
<head>
<meta charset="utf-8">
<title>aussagekräftiger Titel der Seite</title>
</head>
<body>
<p>Der Inhalt der Seite</p>
</body>
<!-- Noch ein Kommentar -->
Von der formalen Richtigkeit des obigen Codes kann man sich leicht mit einem Validator überzeugen.
Die Spezifikation bezieht sich hier auf die interne Repräsentation des Browsers. Das Weglassen von Tags wie <html>
ist ja deswegen erlaubt, weil der Browser normalerweise zweifelsfrei feststellen kann, wo das html
-Element beginnt. Wenn auf den Doctype unmittelbar ein <head>
-Tag folgt, dann weiß der Browser – weil an dieser Stelle das head
-Element noch gar nicht folgen darf – dass er zuvor das <html>
-Tag ergänzen muss.
Das einzige kleine Problem dabei sind HTML-Kommentare, die an jeder beliebigen Stelle in die Struktur eingefügt werden können. Da der HTML-Kommentar an dieser Stelle:
<!doctype html>
<!-- Mein Kommentar -->
durchaus korrekt ist, wird der Browser davor also niemals das <html>
-Tag ergänzen. Wenn es also für den HTML-Autor aus irgendeinem Grund wichtig ist, dass der HTML-Kommentar in der internen Repräsentation des Browsers das erste ist, was sich im html
-Element befindet, dann muss er das <html>
-Tag notieren, ansonsten landet der HTML-Kommentar vor dem html
-Element.
Ebenso wird der Browser den Kommentar am Ende der HTML-Datei immer innerhalb des body
-Elements positionieren. Auch hier gilt: Will man den Kommentar am Ende einer HTML-Datei außerhalb des body
-Elements platziert wissen, dann muss man das </body
-Tag notieren.
Entsprechendes gilt auch für die übrigen optionalen Tags, die die Grundstruktur eines HTML-Dokumentes kennzeichnen.
Guter HTML-Stil[Bearbeiten]
Solchermaßen ausgezeichnete HTML-Dokumente werden vom Browser eingelesen und dann geparst: Die HTML-Auszeichnungen werden erkannt und in die Dokumentenstruktur, das DOM umgesetzt. Danach wird dies auf dem Bildschirm gerendert. In Screenreadern verläuft der Prozess identisch, das Dokument wird aber nicht auf dem Bildschirm dargestellt, sondern vorgelesen.
Da Browser, die fehlerhafte HTML-Seiten mit einem Absturz bestrafen, am breiten Markt keine Chance hätten, weil sie und nicht der Webseiten-Ersteller verantwortlich gemacht würden, sind die HTML-Parser der heute verbreiteten Browser ziemlich gutmütige Wesen, die so ziemlich alles schlucken, was ihnen vorgesetzt wird und irgendetwas daraus machen, meistens sogar durchaus das, was der Autor der Web-Seite erreichen wollte.
Trotzdem sollten Sie sich bemühen, sich an bewährte Konventionen zu halten, damit Ihr HTML-Code für Sie, andere Entwickler und Browser übersichtlich und für spätere Änderungen pflegeleicht ist.
- Ihr HTML-Markup sollte fehlerfrei und gültig (valide) sein, damit es von Browsern und anderen Parsern wie Screenreadern gelesen werden kann. HTML ist nur validierbar, wenn Sie eine Doctype-Angabe verwenden.
- Von XML entlehnte Tugenden: Wohlgeformte Syntax erleichtert das Lesen und ermöglicht das Verarbeiten als XML:
- Alle Elementnamen, Attributnamen und deren Werte sind klein geschrieben.
- Attributwerte sind immer in doppelte Anführungszeichen ("") eingefasst.
- Verwenden Sie „sprechende“ Klassennamen, die die Funktion und nicht die Art und Weise der Gestaltung beschreiben.
- Elemente, die in HTML auch ohne schließendes Tag notiert werden dürfen (
p
,th
,td
,dt
,dd
,li
), werden immer mit schließendem Tag notiert. - Achten Sie auf Einrückungen und Leerzeilen, um Ihren Code übersichtlich zu gliedern.
Exkurs: XHTML[Bearbeiten]
<h1>
und <H1>
das Gleiche. Im XML-basierten XHTML müssen die Elementnamen dagegen klein geschrieben werden. Es ist deshalb zu empfehlen, die Elementnamen immer klein zu schreiben, egal ob Sie HTML oder XHTML schreiben wollen.<br>
müssen Sie dann <br />
notieren – also den Elementnamen mit einem abschließenden Schrägstrich. Alternativ dazu können Sie auch <br></br>
notieren, also ein Element mit Anfangs- und End-Tag, aber ohne Inhalt.Weblinks[Bearbeiten]
- Jens Oliver Meiert: Elemente, Tags und Attribute
- Matthias Apsel: Unterschied zwischen Element, Tag und Attribut in HTML bzw. XHTML