Sprachkürzel
Inhaltsverzeichnis
Sprachenkürzel nach RFC 5646 (ursprünglich RFC 1766)
Die in den Spezifikationen von W3 und WHATWG immer wieder erwähnte "Angabe von Sprachenkürzeln" wurde ursprünglich im RFC 1766 definiert. Dieser wurde mehrfach durch neuere RFCs ersetzt, aktuell sind RFC 5646 und RFC 4647. Man findet in den Spezifikationen auch die Bezeichnung BCP47 (Best Current Practice), die eine Zusammenfassung dieser beiden RFC darstellt.
Die IETF beschreibt lediglich das Format, wie Sprachkürzel auszusehen haben. Die Registrierung tatsächlich verwendeter Sprachen obliegt der IANA (IANA Protokolle: Language Tags).
Diese Sprachenkürzel basieren auf den Normen ISO 639-1 zur Kurzbezeichnung von Sprachen und ISO 3166-1 zur Kurzbezeichnung von Ländern. Diese von den beiden ISO-Normen vordefinierten Kürzel erlauben solche Angaben wie de
für Deutsch, en
für Englisch oder en-US
für US-Englisch. Der RFC 1766 erlaubt darüber hinaus, feinere Abstufungen für schriftkulturelle, dialektale oder andere lokale Ausprägungen der gleichen Sprache registrieren zu lassen, so z. B. die beiden norwegischen Schriftsprachenvarianten, notiert durch no-nyn
und no-bok
(wobei diese – in Langform no-nynorsk
und no-bokmaal
im RFC 1766 beispielhaft aufgezählten – Kürzel zwischenzeitlich veraltet sind, da es mittlerweile die zweibuchstabigen Kürzel nn
und nb
gibt). Für Sprachen, die in mehreren Ländern oder von bestimmten Gruppen gesprochen werden, und bei denen die Länderzuordnung deshalb problematisch ist, wird das einbuchstabige Startkürzel i
(für irregulär) reserviert. Die Reservierung erfolgt durch die Internet-Behörde IANA. So werden Bezeichnungen wie i-mingo
(Eine Sprache der Irokesen) möglich. Einige dieser i
Kürzel sind mittlerweile missbilligt, weil es reguläre Sprachkürzel dafür gibt, z.B. tlh
statt i-klingon
.
Außerdem wird ein Startkürzel x
für den privaten Gebrauch reserviert, wodurch Sprachenkürzel wie x-selfhtml
(für "SELFHTMLisch") bezeichnet werden können.
Die RFC 1766 Überarbeitung RFC 3066 ließ auch dreibuchstabige Sprachenkürzel nach der Norm ISO 639-2 zu, etwa nds
für Niederdeutsch. Die HTML- und CSS-Spezifikationen des W3-Konsortiums beziehen sich an den relevanten Stellen jedoch noch auf den älteren RFC 1766. Für XML gilt der neuere RFC 3066. Ebenso gibt es eine neuere Norm ISO 3166-1 alpha-3, die dreibuchstabige Ländercodes enthält. Maßgeblich für Internet-Belange sind aber in den meisten Fällen noch die älteren, zweibuchstabigen Kürzel.
Bedeutung für Webautoren
Für Web-Autoren haben die Sprachenkürzel an folgenden Stellen Bedeutung:
- Geben Sie die Sprache des Inhaltes einer Internetseite im
lang
-Attribut des html-Elements an. - Verwenden Sie das
lang
-Attribut ebenfalls, wenn es Abschnitte oder einzelne Elemente (section
,article
,p
,span
,abbr
, …) in einer anderen Sprache gibt. Ebenfalls erwartet wird eine Angabe einer abweichenden Sprache bei den Elementena
undlink
imhreflang
-Attribut. - In JavaScript haben die Sprachenkürzel beispielsweise bei der Eigenschaft
navigator.language
Bedeutung. - Im Zusammenhang mit der CGI-Schnittstelle gibt es die Umgebungsvariable
HTTP_ACCEPT_LANGUAGE
, in der solche Sprachenkürzel verwendet werden.
Länderkürzel nach ISO 3166 werden auch noch an anderen Stellen eingesetzt, so etwa bei den landesspezifischen Top-Level-Domains, wie sie beispielsweise in den Statistiken zu einem Web-Projekt auftauchen können.
Übersicht zu Sprachenkürzeln nach ISO 639-1
Die folgenden Sprachenkürzel können Sie auch überall dort verwenden, wo Angaben nach RFC 1766 gefordert sind. In den meisten Fällen reichen die Original-Sprachenkürzel nach ISO 639-1 zur Bezeichnung der Sprache auch vollkommen aus. Die Tabelle ist nach Kürzeln alphabetisch sortiert und erhebt keinen Anspruch auf aktuelle Vollständigkeit. Streichungen, Ergänzungen, Neueinträge von Sprachenkürzeln notiert die Library of Congress (dokumentiert auf der Seite ISO 639-2/RA Change Notice).
Kürzel | Bedeutung | Schreibweise in eigener Sprache |
---|---|---|
aa
|
Afar | Qafár af |
ab
|
Abchasisch | aab |
af
|
Afrikaans | Afrikaans |
am
|
Amharisch | አማርኛ |
ar
|
Arabisch | العربية |
as
|
Assamesisch | অসমীয়া |
ay
|
Aymara | Aymar aru |
az
|
Aserbaidschanisch | azərbaycanca |
ba
|
Baschkirisch | башҡортса |
be
|
Belorussisch | беларуская |
bg
|
Bulgarisch | български |
bh
|
Biharisch | भोजपुरी |
bi
|
Bislamisch | Bislama |
bn
|
Bengalisch | বাংলা |
bo
|
Tibetanisch | བོད་ཡིག |
br
|
Bretonisch | brezhoneg |
ca
|
Katalanisch | català |
co
|
Korsisch | corsu |
cs
|
Tschechisch | čeština |
cy
|
Walisisch | Cymraeg |
da
|
Dänisch | dansk |
de
|
Deutsch | Deutsch |
dz
|
Dzongkha, Bhutani | ཇོང་ཁ |
el
|
Griechisch | Ελληνικά |
en
|
Englisch | English |
eo
|
Esperanto | Esperanto |
es
|
Spanisch | español |
et
|
Estnisch | eesti |
eu
|
Baskisch | euskara |
fa
|
Persisch | فارسی |
fi
|
Finnisch | suomi |
fj
|
Na Vosa Vakaviti | Fiji |
fo
|
Färöisch | føroyskt |
fr
|
Französisch | français |
fy
|
Friesisch | Frysk |
ga
|
Irisch | Gaeilge |
gd
|
Schottisches Gälisch | Gàidhlig |
gl
|
Galizisch | galego |
gn
|
Guarani | Avañe'ẽ |
gu
|
Gujaratisch | ગુજરાતી |
ha
|
Haussa | Hausa |
he
|
Hebräisch | עברית |
hi
|
Hindi | हिन्दी |
hr
|
Kroatisch | hrvatski |
hu
|
Ungarisch | magyar |
hy
|
Armenisch | Հայերեն |
ia
|
Interlingua | interlingua |
id
|
Indonesisch | Bahasa Indonesia |
ie
|
Interlingue | Interlingue |
ik
|
Inupiak | Iñupiak |
is
|
Isländisch | íslenska |
it
|
Italienisch | italiano |
iu
|
Inuktitut (Eskimo) | ᐃᓄᒃᑎᑐᑦ/inuktitut |
iw
|
Hebräisch (veraltet, nun: he) | iw |
ja
|
Japanisch | 日本語 |
ji
|
Jiddish (veraltet, nun: yi) | ji |
jv
|
Javanisch | Basa Jawa |
ka
|
Georgisch | ქართული |
kk
|
Kasachisch | қазақша |
kl
|
Kalaallisut (Grönländisch) | kalaallisut |
km
|
Kambodschanisch | ភាសាខ្មែរ |
kn
|
Kannada | ಕನ್ನಡ |
ko
|
Koreanisch | 한국어 |
ks
|
Kaschmirisch | कॉशुर / کٲشُر |
ku
|
Kurdisch | Kurdî |
ky
|
Kirgisisch | Кыргызча |
la
|
Lateinisch | Latina |
ln
|
Lingala | lingála |
lo
|
Laotisch | ລາວ |
lt
|
Litauisch | lietuvių |
lv
|
Lettisch | latviešu |
mg
|
Malagasisch | Malagasy |
mi
|
Maorisch | Māori |
mk
|
Mazedonisch | македонски |
ml
|
Malajalam | മലയാളം |
mn
|
Mongolisch | монгол |
mo
|
Moldavisch | молдовеняскэ |
mr
|
Marathi | मराठी |
ms
|
Malaysisch | Bahasa Melayu |
mt
|
Maltesisch | Malti |
my
|
Burmesisch | မြန်မာဘာသာ |
na
|
Nauruisch | Dorerin Naoero |
ne
|
Nepalesisch | नेपाली |
nl
|
Niederländisch | Nederlands |
no
|
Norwegisch | norsk bokmål |
oc
|
Okzitanisch | occitan |
om
|
Oromo | Oromoo |
or
|
Oriya | ଓଡ଼ିଆ |
pa
|
Pundjabisch | ਪੰਜਾਬੀ |
pl
|
Polnisch | polski |
ps
|
Paschtu | پښتو |
pt
|
Portugiesisch | português |
qu
|
Quechua | Runa Simi |
rm
|
Rätoromanisch | rumantsch |
rn
|
Kirundisch | Kirundi |
ro
|
Rumänisch | română |
ru
|
Russisch | русский |
rw
|
Kijarwanda | Kinyarwanda |
sa
|
Sanskrit | संस्कृतम् |
sd
|
Zinti | سنڌي |
sg
|
Sango | Sängö |
sh
|
Serbokroatisch (veraltet) | srpskohrvatski / српскохрватски |
si
|
Singhalesisch | සිංහල |
sk
|
Slowakisch | slovenčina |
sl
|
Slowenisch | slovenščina |
sm
|
Samoanisch | Gagana Samoa |
sn
|
Schonisch | chiShona |
so
|
Somalisch | Soomaaliga |
sq
|
Albanisch | shqip |
sr
|
Serbisch | српски / srpski |
ss
|
Swasiländisch | SiSwati |
st
|
Sesothisch | Sesotho |
su
|
Sudanesisch | Basa Sunda |
sv
|
Schwedisch | svenska |
sw
|
Suaheli | Kiswahili |
ta
|
Tamilisch | தமிழ் |
te
|
Tegulu | తెలుగు |
tg
|
Tadschikisch | тоҷикӣ |
th
|
Thai | ไทย |
ti
|
Tigrinja | ትግርኛ |
tk
|
Turkmenisch | Türkmençe |
tl
|
Tagalog | Tagalog |
tn
|
Sezuan | Setswana |
to
|
Tongaisch | lea faka-Tonga |
tr
|
Türkisch | Türkçe |
ts
|
Tsongaisch | Xitsonga |
tt
|
Tatarisch | татарча/tatarça |
tw
|
Twi | Twi |
ug
|
Uigur | ئۇيغۇرچە / Uyghurche |
uk
|
Ukrainisch | українська |
ur
|
Urdu | اردو |
uz
|
Usbekisch | oʻzbekcha/ўзбекча |
vi
|
Vietnamesisch | Tiếng Việt |
vo
|
Volapük | Volapük |
wo
|
Wolof | Wolof |
xh
|
Xhosa | isiXhosa |
yi
|
Jiddish | ייִדיש |
yo
|
Joruba | Yorùbá |
za
|
Zhuang | Vahcuengh |
zh
|
Chinesisch | 中文 |
zu
|
Zulu | isiZulu |
Beispiele für zusammengesetzte Sprachenkürzel
Die folgende Tabelle zeigt einige Beispiele für zusammengesetzte Sprachenkürzel, wie sie nach RFC 1766 erlaubt sind:
Kürzel | Bedeutung |
---|---|
de-DE
|
Deutsches deutsch |
de-CH
|
Schweizerdeutsch |
de-AT
|
österreichisches Deutsch |
en-US
|
amerikanisches Englisch |
en-CA
|
kanadisches Englisch |
en-AU
|
australisches Englisch |
en-GB
|
britisches Englisch |
en-UK
|
königlich-britisches Englisch |
cel-gaulish
|
Gallisch |
fr-CA
|
kanadisches Französisch |
zh-TW
|
Taiwan-Chinesisch |
zh-guoyu
|
Mandarin-Chinesisch |
zh-min-nan
|
Min-Nan-Chinesisch |
zh-xiang
|
Xiang-Chinesisch |