UTF-8

Aus SELFHTML-Wiki
Wechseln zu: Navigation, Suche

UTF-8 (Abk. für 8-Bit UCS Transformation Format) ist die am weitesten verbreitete Zeichencodierung für Unicode-Zeichen.

UTF-8 ist in den ersten 128 Zeichen (Indizes 0–127) deckungsgleich mit ASCII. Es eignet sich mit in der Regel nur einem Byte Speicherbedarf für Zeichen vieler westlicher Sprachen besonders für die Codierung englischsprachiger Texte, die sich im Regelfall ohne Modifikation daher sogar mit nicht-UTF-8-fähigen Texteditoren ohne Beeinträchtigung bearbeiten lassen.

UTF-8 ist der de-facto-Standard für die Zeichencodierung des Internets und damit verbundener Dokumenttypen. 2015 nutzten 86% aller Webseiten UTF-8.[1]

Siehe auch


Quellen

  1. http://w3techs.com/technologies/history_overview/character_encoding