URL-Codierung

Aus SELFHTML-Wiki
Wechseln zu: Navigation, Suche

In einer URL haben einige Zeichen eine besondere Bedeutung, weswegen Zeichen, die Datenbestandteil sein sollen, in einer gesonderten Form zu notieren sind: prozent-codiert. Beispielsweise leitet das Zeichen # (Doppelkreuz, Raute, Hash) eine Sprungziel-Angabe innerhalb einer Seite (Anker, Fragment) ein. Möchte man das #-Zeichen im Query-Teil verwenden, der vor dem Anker notiert werden muss, so ist es als %23 zu notieren. Der Zahlenwert entspricht dabei der hexadezimalen Notation des Bytewertes. Auch bei Codierungen, die mehr als ein Byte pro Zeichen verwenden, wird byteweise codiert. Ein in UTF-8 codiertes Ä ist als %C3%84 zu schreiben und ISO-8859-1-kodiert wäre es %C4.

Eine Besonderheit stellt das Leerzeichen (Space) dar, das im Pfadteil als %20 und im Query-String als + zu schreiben ist. In der Regel können alle Systeme auch ein %20 im Query-String als Leerzeichen erkennen.

Für die Web-relevanten Programmiersprachen steht üblicherweise eine Funktion bereit, welche die URL-Codierung übernimmt. In PHP ist urlencode() für den Query-String und rawurlencode() für Daten vorgesehen, die im Pfadteil eingefügt werden sollen.

JavaScript:

siehe auch[Bearbeiten]

Weblinks[Bearbeiten]