Sprachkürzel

Aus SELFHTML-Wiki
Wechseln zu: Navigation, Suche

Sprachenkürzel nach RFC 5646 (ursprünglich RFC 1766)

Die in den Spezifikationen von W3 und WHATWG immer wieder erwähnte "Angabe von Sprachenkürzeln" wurde ursprünglich im RFC 1766 definiert. Dieser wurde mehrfach durch neuere RFCs ersetzt, aktuell sind RFC 5646 und RFC 4647. Man findet in den Spezifikationen auch die Bezeichnung BCP47 (Best Current Practice), die eine Zusammenfassung dieser beiden RFC darstellt.

Die IETF beschreibt lediglich das Format, wie Sprachkürzel auszusehen haben. Die Registrierung tatsächlich verwendeter Sprachen obliegt der IANA (IANA Protokolle: Language Tags).

Diese Sprachenkürzel basieren auf den Normen ISO 639-1 zur Kurzbezeichnung von Sprachen und ISO 3166-1 zur Kurzbezeichnung von Ländern. Diese von den beiden ISO-Normen vordefinierten Kürzel erlauben solche Angaben wie de für Deutsch, en für Englisch oder en-US für US-Englisch. Der RFC 1766 erlaubt darüber hinaus, feinere Abstufungen für schriftkulturelle, dialektale oder andere lokale Ausprägungen der gleichen Sprache registrieren zu lassen, so z. B. die beiden norwegischen Schriftsprachenvarianten, notiert durch no-nyn und no-bok (wobei diese – in Langform no-nynorsk und no-bokmaal im RFC 1766 beispielhaft aufgezählten – Kürzel zwischenzeitlich veraltet sind, da es mittlerweile die zweibuchstabigen Kürzel nn und nb gibt). Für Sprachen, die in mehreren Ländern oder von bestimmten Gruppen gesprochen werden, und bei denen die Länderzuordnung deshalb problematisch ist, wird das einbuchstabige Startkürzel i (für irregulär) reserviert. Die Reservierung erfolgt durch die Internet-Behörde IANA. So werden Bezeichnungen wie i-mingo (Eine Sprache der Irokesen) möglich. Einige dieser i Kürzel sind mittlerweile missbilligt, weil es reguläre Sprachkürzel dafür gibt, z.B. tlh statt i-klingon. Außerdem wird ein Startkürzel x für den privaten Gebrauch reserviert, wodurch Sprachenkürzel wie x-selfhtml (für "SELFHTMLisch") bezeichnet werden können.

Die RFC 1766 Überarbeitung RFC 3066 ließ auch dreibuchstabige Sprachenkürzel nach der Norm ISO 639-2 zu, etwa nds für Niederdeutsch. Die HTML- und CSS-Spezifikationen des W3-Konsortiums beziehen sich an den relevanten Stellen jedoch noch auf den älteren RFC 1766. Für XML gilt der neuere RFC 3066. Ebenso gibt es eine neuere Norm ISO 3166-1 alpha-3, die dreibuchstabige Ländercodes enthält. Maßgeblich für Internet-Belange sind aber in den meisten Fällen noch die älteren, zweibuchstabigen Kürzel.

Bedeutung für Webautoren

Für Web-Autoren haben die Sprachenkürzel an folgenden Stellen Bedeutung:

  • Geben Sie die Sprache des Inhaltes einer Internetseite im lang-Attribut des html-Elements an.
  • Verwenden Sie das lang-Attribut ebenfalls, wenn es Abschnitte oder einzelne Elemente (section, article, p, span, abbr, …) in einer anderen Sprache gibt. Ebenfalls erwartet wird eine Angabe einer abweichenden Sprache bei den Elementen a und link im hreflang-Attribut.
  • In JavaScript haben die Sprachenkürzel beispielsweise bei der Eigenschaft navigator.language Bedeutung.
  • Im Zusammenhang mit der CGI-Schnittstelle gibt es die Umgebungsvariable HTTP_ACCEPT_LANGUAGE, in der solche Sprachenkürzel verwendet werden.

Länderkürzel nach ISO 3166 werden auch noch an anderen Stellen eingesetzt, so etwa bei den landesspezifischen Top-Level-Domains, wie sie beispielsweise in den Statistiken zu einem Web-Projekt auftauchen können.

Übersicht zu Sprachenkürzeln nach ISO 639-1

Die folgenden Sprachenkürzel können Sie auch überall dort verwenden, wo Angaben nach RFC 1766 gefordert sind. In den meisten Fällen reichen die Original-Sprachenkürzel nach ISO 639-1 zur Bezeichnung der Sprache auch vollkommen aus. Die Tabelle ist nach Kürzeln alphabetisch sortiert und erhebt keinen Anspruch auf aktuelle Vollständigkeit. Streichungen, Ergänzungen, Neueinträge von Sprachenkürzeln notiert die Library of Congress (dokumentiert auf der Seite ISO 639-2/RA Change Notice).

Kürzel Bedeutung Schreibweise in eigener Sprache
aa Afar Qafár af
ab Abchasisch aab
af Afrikaans Afrikaans
am Amharisch አማርኛ
ar Arabisch العربية
as Assamesisch অসমীয়া
ay Aymara Aymar aru
az Aserbaidschanisch azərbaycanca
ba Baschkirisch башҡортса
be Belorussisch беларуская
bg Bulgarisch български
bh Biharisch भोजपुरी
bi Bislamisch Bislama
bn Bengalisch বাংলা
bo Tibetanisch བོད་ཡིག
br Bretonisch brezhoneg
ca Katalanisch català
co Korsisch corsu
cs Tschechisch čeština
cy Walisisch Cymraeg
da Dänisch dansk
de Deutsch Deutsch
dz Dzongkha, Bhutani ཇོང་ཁ
el Griechisch Ελληνικά
en Englisch English
eo Esperanto Esperanto
es Spanisch español
et Estnisch eesti
eu Baskisch euskara
fa Persisch فارسی
fi Finnisch suomi
fj Na Vosa Vakaviti Fiji
fo Färöisch føroyskt
fr Französisch français
fy Friesisch Frysk
ga Irisch Gaeilge
gd Schottisches Gälisch Gàidhlig
gl Galizisch galego
gn Guarani Avañe'ẽ
gu Gujaratisch ગુજરાતી
ha Haussa Hausa
he Hebräisch עברית
hi Hindi हिन्दी
hr Kroatisch hrvatski
hu Ungarisch magyar
hy Armenisch Հայերեն
ia Interlingua interlingua
id Indonesisch Bahasa Indonesia
ie Interlingue Interlingue
ik Inupiak Iñupiak
is Isländisch íslenska
it Italienisch italiano
iu Inuktitut (Eskimo) ᐃᓄᒃᑎᑐᑦ/inuktitut
iw Hebräisch (veraltet, nun: he) iw
ja Japanisch 日本語
ji Jiddish (veraltet, nun: yi) ji
jv Javanisch Basa Jawa
ka Georgisch ქართული
kk Kasachisch қазақша
kl Kalaallisut (Grönländisch) kalaallisut
km Kambodschanisch ភាសាខ្មែរ
kn Kannada ಕನ್ನಡ
ko Koreanisch 한국어
ks Kaschmirisch कॉशुर / کٲشُر
ku Kurdisch Kurdî
ky Kirgisisch Кыргызча
la Lateinisch Latina
ln Lingala lingála
lo Laotisch ລາວ
lt Litauisch lietuvių
lv Lettisch latviešu
mg Malagasisch Malagasy
mi Maorisch Māori
mk Mazedonisch македонски
ml Malajalam മലയാളം
mn Mongolisch монгол
mo Moldavisch молдовеняскэ
mr Marathi मराठी
ms Malaysisch Bahasa Melayu
mt Maltesisch Malti
my Burmesisch မြန်မာဘာသာ
na Nauruisch Dorerin Naoero
ne Nepalesisch नेपाली
nl Niederländisch Nederlands
no Norwegisch norsk bokmål
oc Okzitanisch occitan
om Oromo Oromoo
or Oriya ଓଡ଼ିଆ
pa Pundjabisch ਪੰਜਾਬੀ
pl Polnisch polski
ps Paschtu پښتو
pt Portugiesisch português
qu Quechua Runa Simi
rm Rätoromanisch rumantsch
rn Kirundisch Kirundi
ro Rumänisch română
ru Russisch русский
rw Kijarwanda Kinyarwanda
sa Sanskrit संस्कृतम्
sd Zinti سنڌي
sg Sango Sängö
sh Serbokroatisch (veraltet) srpskohrvatski / српскохрватски
si Singhalesisch සිංහල
sk Slowakisch slovenčina
sl Slowenisch slovenščina
sm Samoanisch Gagana Samoa
sn Schonisch chiShona
so Somalisch Soomaaliga
sq Albanisch shqip
sr Serbisch српски / srpski
ss Swasiländisch SiSwati
st Sesothisch Sesotho
su Sudanesisch Basa Sunda
sv Schwedisch svenska
sw Suaheli Kiswahili
ta Tamilisch தமிழ்
te Tegulu తెలుగు
tg Tadschikisch тоҷикӣ
th Thai ไทย
ti Tigrinja ትግርኛ
tk Turkmenisch Türkmençe
tl Tagalog Tagalog
tn Sezuan Setswana
to Tongaisch lea faka-Tonga
tr Türkisch Türkçe
ts Tsongaisch Xitsonga
tt Tatarisch татарча/tatarça
tw Twi Twi
ug Uigur ئۇيغۇرچە / Uyghurche
uk Ukrainisch українська
ur Urdu اردو
uz Usbekisch oʻzbekcha/ўзбекча
vi Vietnamesisch Tiếng Việt
vo Volapük Volapük
wo Wolof Wolof
xh Xhosa isiXhosa
yi Jiddish ייִדיש
yo Joruba Yorùbá
za Zhuang Vahcuengh
zh Chinesisch 中文
zu Zulu isiZulu

Beispiele für zusammengesetzte Sprachenkürzel

Die folgende Tabelle zeigt einige Beispiele für zusammengesetzte Sprachenkürzel, wie sie nach RFC 1766 erlaubt sind:

Kürzel Bedeutung
de-DE Deutsches deutsch
de-CH Schweizerdeutsch
de-AT österreichisches Deutsch
en-US amerikanisches Englisch
en-CA kanadisches Englisch
en-AU australisches Englisch
en-GB britisches Englisch
en-UK königlich-britisches Englisch
cel-gaulish Gallisch
fr-CA kanadisches Französisch
zh-TW Taiwan-Chinesisch
zh-guoyu Mandarin-Chinesisch
zh-min-nan Min-Nan-Chinesisch
zh-xiang Xiang-Chinesisch