HTML/Regeln/Textauszeichnung

Aus SELFHTML-Wiki
Wechseln zu: Navigation, Suche

HTML-Dateien bestehen aus dem normalen Text, den der Besucher der Webseite später sehen wird. Hinzu kommt der Code, der zur Textauszeichnung (und Textstrukturierung) dient, also definiert, was beispielsweise ein Absatz oder eine Überschrift ist. Zur Textauszeichnung gibt es bestimmte Zeichen aus dem normalen Zeichenvorrat.

Inhaltsverzeichnis

[Bearbeiten] Elemente und Tags in HTML

Der Inhalt von HTML-Dateien wird mit HTML-Elementen ausgezeichnet. HTML-Elemente werden durch so genannte Tags markiert. Fast alle HTML-Elemente werden durch ein einleitendes und ein abschließendes Tag markiert. Der Inhalt dazwischen ist der „Gültigkeitsbereich“ des entsprechenden Elements. Tags werden in spitzen Klammern notiert.

Beispiel ansehen …
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>Elemente und Tags</title> </head> <body> <h1>HTML - die Sprache des Web</h1> </body> </html>
Das Beispiel zeigt eine Überschrift 1. Ordnung. Das einleitende Tag <h1> signalisiert, dass eine Überschrift 1. Ordnung folgt (h = heading = Überschrift). Das abschließende Tag </h1> signalisiert das Ende der Überschrift. Ein abschließendes Tag beginnt mit einer öffnenden spitzen Klammer und einem Schrägstrich </.
Beachten Sie: Bei HTML spielt es keine Rolle, ob die Elementnamen in den Tags in Klein- oder Großbuchstaben notiert werden. Dort bedeuten z.B. <h1> und <H1> das Gleiche. Im XML-basierten XHTML müssen die Elementnamen dagegen klein geschrieben werden. Es ist deshalb zu empfehlen, die Elementnamen immer klein zu schreiben, egal ob Sie HTML oder XHTML schreiben wollen.

Es gibt auch einige Elemente mit „Standalone-Tags“, d.h. Elemente, die keinen Inhalt haben und deshalb nur aus einem Tag bestehen statt aus Anfangs- und End-Tag.

Beispiel ansehen …
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>Leere „standalone“ Elemente und Tags</title> </head> <body> <p>Vom Eise befreit sind Strom und Bäche<br> Durch des Frühlings holden, belebenden Blick</p> </body> </html>
Am Ende der ersten Zeile signalisiert <br>, dass ein manueller Zeilenumbruch eingefügt werden soll (br = break = Umbruch).
Beachten Sie: Wenn Sie XHTML-gerecht schreiben wollen, müssen Sie Elemente mit Standalone-Tags anders notieren: Anstelle von <br> müssen Sie dann <br /> notieren – also den Elementnamen mit einem abschließenden Schrägstrich. Alternativ dazu können Sie auch <br></br> notieren, also ein Element mit Anfangs- und End-Tag, aber ohne Inhalt. Mehr darüber erfahren Sie im Unterkapitel XHTML und HTML.

[Bearbeiten] Verschachtelung von Elementen

Elemente können ineinander verschachtelt werden. Auf diese Weise entsteht eine hierarchische Struktur. Komplexere HTML-Dateien enthalten sehr viele Verschachtelungen. Deshalb sprechen Fachleute auch von strukturiertem Markup.

Beispiel ansehen …
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>Verschachtelung von Elementen</title> </head> <body> <h1><em>HTML</em> - die Sprache des Web</h1> </body> </html>
Mit dem Element em wird ein Teil eines Fließtextes als betont (engl. emphasized) ausgezeichnet. Der Text zwischen <em> und </em> erhält in den meisten Browsern eine andere Darstellung, häufig kursiv.

[Bearbeiten] Attribute in Tags

Einleitende Tags und Standalone-Tags können zusätzliche Angaben enthalten.

Beispiel ansehen …
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title>Attribute in Tags</title> </head> <body> <p> Wenn Sie den SELFHTML-Text weiterlesen wollen, dann öffnen Sie die folgenden Verweise am besten in einem neuen Fenster oder Tab. </p> <p> Neuigkeiten halten für Sie die <a href="http://www.tagesschau.de/">ARD Tagesschau</a> oder auch <a href="http://www.heute.de/">ZDF heute</a> bereit. </p> </body> </html>
Durch die unterschiedlichen href-Attribute zeigen die beiden Verweise auf unterschiedliche Ziele.

Es gibt folgende Arten von Attributen in HTML-Elementen:

  • Attribute mit Zuweisung vorgegebener Werte, z.B. bei <input type="text">, einem Eingabefeld für einfachen Text – hier sind nur bestimmte Werte erlaubt.
  • Attribute mit freier Wertzuweisung, wobei jedoch ein bestimmter Datentyp oder eine bestimmte Konvention erwartet wird, z.B. bei <style type="text/css">, um einen Bereich für Stylesheets zu definieren. Hier wird ein so genannter MIME-Typ als Wert erwartet, und MIME-Typen haben immer den Aufbau Typ/Untertyp. Oder <input type="text" maxlength="10"> – ein Eingabefeld, in das der Benutzer bis zu 10 Zeichen eingeben kann - hier wird eine numerische Angabe erwartet.
  • Attribute mit freier Wertzuweisung ohne weitere Konventionen, z.B. <p title="Aussage mit Vorbehalt"> – hier kann ein beliebiger Text zugewiesen werden.
  • Alleinstehende Attribute, z.B. <input type="text" readonly> (nur lesbares Textfeld). Alleinstehende Attribute gibt es allerdings nur bei HTML (einschließlich HTML5). Wenn Sie XHTML-gerecht schreiben wollen, müssen Sie <input readonly="readonly"> notieren. Mehr darüber erfahren Sie im Unterkapitel XHTML und HTML.

HTML5 verlangt Anführungszeichen nur, wenn im Attributwert " ' ` = < > sowie Leerzeichen enthalten sind. Für HTML 4.01 dürfen Attribute ohne Anführungszeichen notiert werden, wenn sie nur a-z, A-Z, 0-9 und - . _ : enthalten.

Empfehlung: Obwohl es also vom HTML-Standard her zulässig wäre, dass bestimmte Attributwerte auch ohne Anführungszeichen geschrieben werden können, sollten Sie diese Möglichkeit nicht nutzen. Es verringert die Wahrscheinlichkeit von Fehlern, wenn Sie grundsätzlich alle Werte, die Sie Attributen zuweisen, in einfache ' oder doppelte " Anführungszeichen setzen. Sie können diese zwei Arten innerhalb einer Datei beliebig mischen, lediglich für ein einzelnes Attribut müssen an Anfang und Ende dieselben Zeichen benutzt werden. Welches Zeichen Sie wählen, ist im Prinzip egal.

Wie bei Elementnamen, so gilt auch bei Attributnamen: Bei HTML (einschließlich HTML5) spielt es keine Rolle, ob die Attributnamen in Klein- oder Großbuchstaben notiert werden. Im XML-basierten XHTML müssen die Attributnamen dagegen durchgehend klein geschrieben werden. Bei den Wertzuweisungen an Attribute kann Groß- und Kleinschreibung abhängig von der Art des Wertes unterschieden werden oder auch nicht.

Neben Attributen, die nur in bestimmten HTML-Elementen vorkommen können, gibt es auch so genannte Universalattribute, die in vielen bzw. fast allen HTML-Elementen erlaubt sind.

Beispiel: Universalattribut id
<p id="Einleitung">Text</p>
Das Beispiel definiert einen Textabsatz mit den HTML-Tags <p> und </p>. Im einleitenden <p>-Tag wird ein Universalattribut notiert, nämlich das Attribut id. Damit können Sie dokumentweit eindeutige Namen für einzelne HTML-Elemente vergeben. Einzelheiten über solche Attribute erfahren Sie im Abschnitt über Universalattribute.

[Bearbeiten] HTML-Parser

Unter einem HTML-Parser versteht man eine Software, die HTML-Auszeichnungen erkennt und in strukturierten Text umsetzt. Jeder Web-Browser verfügt über einen HTML-Parser, um überhaupt mit HTML klarzukommen. Solche HTML-Parser werden nun leider auf vielen Web-Seiten mit Syntaxfehlern in der Textauszeichnung konfrontiert. Oft sind es kleinere, nicht allzu tragische Fehler, doch es gibt auch viele Web-Seiten, deren HTML-Quelltext nur das Prädikat „ungenügend“ verdient, weil darin sehr stark die HTML-Regeln missachtet wurden. Strenge Parser, die genau auf Einhaltung der HTML-Regeln prüfen, müssten die Anzeige solcher Web-Seiten eigentlich abbrechen, und anstelle der Seite würden die Browser dann nur eine lapidare Fehlermeldung anzeigen. Da ein solcher Browser am breiten Markt jedoch keine Chance hätte, weil er kaum eine bekannte Web-Seite anzeigen würde, sind die HTML-Parser der heute verbreiteten Browser ziemlich gutmütige Wesen, die so ziemlich alles schlucken, was ihnen vorgesetzt wird und irgendetwas daraus machen, meistens sogar durchaus das, was der Autor der Web-Seite erreichen wollte.

Bei der Spezifikation von HTML5 hat man versucht, auch die Fehlerbehandlung der Browser zu vereinheitlichen. Das bedeutet, dass HTML5-konforme Browser das gleiche Verhalten aufweisen sollen, wenn sie auf eine (X)HTML-Seite mit fehlerhaftem (X)HTML treffen. Bis die Browserhersteller diese Fehlerbehandlung in ihre Produkte eingebaut haben, werden aber sicher noch einige Jahre vergehen.

Angesichts der wachsenden Komplexität der verschiedenen Sprachen, also HTML in Verbindung mit eingebettetem CSS, JavaScript, PHP usw., wird es jedenfalls immer wichtiger, die Syntax-Regeln von HTML einzuhalten. Diese allgemeinen Regeln haben Sie im vorhergehenden Text kennengelernt, die Verschachtelungsregeln der Elemente finden Sie in der HTML-Referenz.

[Bearbeiten] Validierung

Wenn Sie prüfen wollen, ob Ihre selbst erstellte HTML-Seite alle Regeln einhält, können Sie das mit einem sogenannten Validator tun.

Der Sinn des Validierens mag eventuell trotzdem noch recht abstrakt wirken, und tatsächlich ist ein valides HTML-Dokument nicht zwangsläufig „gut“ geschrieben (siehe dazu HTML/Guter_HTML-Stil), genauso wenig, wie eine nicht valide Seite für den Besucher unbrauchbar sein muss.

Besonders wenn Sie auf HTML aufsetzende Techniken verwenden, wie CSS und JavaScript, sollten Sie für einen korrekten Unterbau sorgen, damit sich nicht dadurch und die unterschiedlichen Fehlerkorrekturverfahren der Browser unterschiedliches Verhalten ergibt.

Das Validieren kann auch in rechtlicher Hinsicht sinnvoll sein. Bei Rechtsstreitigkeiten in Bezug auf ein Webangebot berücksichtigen die Gerichte (der BRD) gewöhnlich, ob der „Stand der Technik“ bzw. die „anerkannten technischen Normen und Regeln“ eingehalten worden sind. Sind Webseiten nicht valide, dann sind diese Normen und Regeln folglich nicht eingehalten worden. Wenn also beispielsweise die vom deutschen Telemediengesetz oder Rundfunkstaatsvertrag geforderten Informationspflichten eines Webangebots nicht „leicht erkennbar“ und das Webangebot zudem nicht valide ist, kann das Auswirkungen auf das Ergebnis haben.

Meine Werkzeuge
Namensräume

Varianten
Aktionen
Übersicht
Schnell‑Index
Mitmachen
Werkzeuge
Spenden
SELFHTML