HTML/Regeln/Zeichencodierung

Aus SELFHTML-Wiki
Wechseln zu: Navigation, Suche

Im Computerbereich gibt es verschiedene Zeichensätze und Zeichencodierungen. Der Zeichensatz für HTML-Dokumente ist generell Unicode. Um ein konkretes Dokument zu erstellen, müssen Sie dafür eine Zeichencodierung verwenden. Wenn Sie nichts weiter unternehmen, werden Ihre Werkzeuge (Editor, Browser) als Codierung eine voreingestellte verwenden. Das ist insofern problematisch, als dass alle beteiligten Systeme nun raten müssen, in welcher Codierung ein Dokument vorliegt. Es ist deshalb eine gute Idee, für Klarheit zu sorgen.

Empfehlung: Verwenden Sie für neue Projekte UTF-8 als Zeichencodierung. Stellen Sie sicher, dass Sie diese Zeichencodierung nicht nur angeben, sopndern das Dokument auch wirklich in diesem Format abspeichern. Lesen Sie dazu den Ratschlag zur praktischen Anwendung.
Beachten Sie: Eine korrekt verwendete Zeichencodierung oder eine Ersatzschreibweise für einzelne Zeichen bedeutet nicht zwangsläufig, dass alle Zeichen korrekt dargestellt werden. Es müssen u. U. auch die Schriftarten auf dem Computer installiert werden, die für diese verwendeten Zeichen Darstellungsvorschriften enthalten. Fehlen diese, erscheinen statt der Schriftzeichen Kästchen oder Ähnliches auf dem Bildschirm. Als Autor von Webseiten können Sie Ihrer Webseite die passenden Schriften mitliefern.

HTML-eigene Zeichen maskieren[Bearbeiten]

Durch die oben erwähnte Verwendung von Unicode ist es nicht mehr nötig, Umlaute zu maskieren. Wenn in Ihrem Text jedoch Zeichen vorkommen, die in HTML eine bestimmte Bedeutung haben, müssen Sie diese Zeichen maskieren:

  • Ersetzen Sie das Zeichen & durch die Zeichenfolge & ("Ampersand")
  • Ersetzen Sie das Zeichen < durch die Zeichenfolge &lt; ("lower than")
  • Ersetzen Sie das Zeichen > durch die Zeichenfolge &gt; ("greater than")

Des Weiteren ist es ratsam, an bestimmten Stellen das Zeichen " durch die Zeichenfolge &quot; ("Quote") zu ersetzen. Dies ist vor allem in Attributwerten sinnvoll.

Beispiel
  • Das ist ein &lt;HTML-Tag&gt;
  • GmbH &amp; Co. KG
  • <a href="https://example.com/?id=5&amp;foo=bar">
  • <strong title="bekannt durch den Ausspruch &quot;Ich weiß, dass ich nichts weiß.&quot;">der griechische Philosoph Sokrates</strong>
Beachten Sie vor allem die spitze öffnende Klammer (<). Wenn Sie dieses Zeichen nicht wie vorgeschrieben maskieren, bringen Sie den Web-Browser mit ziemlicher Sicherheit durcheinander, weil er glaubt, nun würde ein HTML-Tag folgen. Außerdem müssen Sie in href-Attributen das Ampersand maskieren.

Leerzeichen, Tabulatoren und Zeilenumbrüche[Bearbeiten]

Wenn Sie einen Texteditor oder einen quelltextorientierten HTML-Editor zur Erstellung Ihrer HTML-Dateien verwenden, sollten Sie folgende Regeln bei der Texteingabe kennen und beachten:

  • Setzen Sie Zeilenumbrüche und Leerzeilen so, dass Sie im Quelltext eine optimale Übersicht behalten. Beachten Sie aber auch, dass Zeilenumbrüche und Absatzschaltungen im Web-Browser nicht so angezeigt werden, wie sie im Quelltext eingegeben wurden. Für Zeilenumbrüche und Absatzschaltungen, die im Browser wirksam sein sollen, müssen Sie die entsprechenden HTML-Elemente verwenden. Wenn Sie aus besonderen Gründen Text im Web-Browser so anzeigen wollen, wie Sie ihn eingeben (mit allen Einrückungen, Umbrüchen usw.), können Sie das pre-Element für präformatierten Text verwenden.
  • Beachten Sie, dass es in HTML keine Tabulatoren gibt. Ein im Quelltext eingegebener Tabulator wird bei der Anzeige im Web-Browser in ein Leerzeichen umgewandelt. Zeilenumbruch-Zeichen, Tabulator-Zeichen und einfache Leerzeichen bilden in HTML die Klasse der so genannten White-Space-Zeichen (white space = "weißer Raum"). Die Browser setzen in der Regel ein Tabulator-Zeichen oder Zeilenumbruch-Zeichen im Editor als Leerzeichen im HTML-Text um. Mehrere solcher White-Space-Zeichen hintereinander werden ignoriert und zu einem einzigen Leerzeichen zusammengefasst. Um mehrere Leerzeichen hintereinander zu erzwingen, können Sie anstelle der normalen Leerzeicheneingabe die Zeichenfolge &#160; (geschütztes Leerzeichen) eingeben, und zwar so oft hintereinander wie gewünscht.



Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]