URL-Codierung
In einer URL haben einige Zeichen eine besondere Bedeutung, weswegen Zeichen, die Datenbestandteil sein sollen, in einer gesonderten Form zu notieren sind: prozent-codiert. Beispielsweise leitet das Zeichen #
(Doppelkreuz, Raute, Hash) eine Sprungziel-Angabe innerhalb einer Seite (Anker, Fragment) ein. Möchte man das #-Zeichen im Query-Teil verwenden, der vor dem Anker notiert werden muss, so ist es als %23
zu notieren. Der Zahlenwert entspricht dabei der hexadezimalen Notation des Bytewertes. Auch bei Codierungen, die mehr als ein Byte pro Zeichen verwenden, wird byteweise codiert. Ein in UTF-8 codiertes Ä ist als %C3%84
zu schreiben und ISO-8859-1-kodiert wäre es %C4
.
Eine Besonderheit stellt das Leerzeichen (Space) dar, das im Pfadteil als %20
und im Query-String als +
zu schreiben ist. In der Regel können alle Systeme auch ein %20
im Query-String als Leerzeichen erkennen.
Für die Web-relevanten Programmiersprachen steht üblicherweise eine Funktion bereit, welche die URL-Codierung übernimmt. In PHP ist urlencode() für den Query-String und rawurlencode() für Daten vorgesehen, die im Pfadteil eingefügt werden sollen.
JavaScript:
Siehe auch
URL-(De)Kodierung
Die URL-(De)Kodierung
ist nur mit JavaScript sicht- und nutzbar.
Weblinks
- Wikipedia: URL-Encoding
- meyerweb.com: URL Decoder/Encoder
- CodePen: SVG-encoder von Yoksel