Przejdź do treści

Języki - HTML

Skróty nazw języków

Wstęp

W tabelach poniżej znajdziesz skróty literowe nazw języków, które mają zastosowanie podczas definiowania języka, w którym napisana jest strona oraz jako wartość atrybutu lang="..." wskazującego język pojedynczego elementu strony.

Kody języków mogą być jednoczłonowe lub dwuczłonowe:

  1. Pierwszy człon (wymagany), najczęściej pisany małymi literami, zawsze określa język mówiony.
  2. Drugi człon (opcjonalny), zwyczajowo pisany wielkimi literami, może wskazywać kraj, terytorium lub region, w którym mówi się w tym języku.

Na przykład en oznacza ogólny język angielski, a en-US - język angielski jakim mówi się w Stanach Zjednoczonych. Jeśli w danym języku mówi się tylko w jednym kraju, terytorium bądź regionie, to co prawda możemy wtedy użyć formy dwuczłonowej (np. pl-PL), jednak najczęściej w takim przypadku korzysta się z krótszego zapisu jednoczłonowego (np. pl).

Nie w każdym przypadku pierwsza część nazwy kodowej (język) i odpowiadający jej drugi człon (obszar) są takie same. Na przykład skrót języka ukraińskiego to uk, natomiast państwo Ukraina jest oznaczane skrótem UA. Zatem pełna nazwa kodowa języka ukraińskiego, którym posługują się mieszkańcy na terenie Ukrainy, to: uk-UA.

Wykaz języków

JęzykSkrót
afrikaansaf
akanak
albańskisq
amharskiam
angielskien
arabskiar
asamskias
azerskiaz
bambarabm
baskijskieu
bengalskibn
białoruskibe
birmańskimy
bośniackibs
bretońskibr
bułgarskibg
chińskizh
chorwackihr
czeskics
duńskida
dzongkhadz
esperantoeo
estońskiet
eweee
farerskifo
fińskifi
francuskifr
fulaniff
galicyjskigl
gandalg
greckiel
grenlandzkikl
gruzińskika
gudźarackigu
hausaha
hebrajskihe
hindihi
hiszpańskies
igboig
indonezyjskiid
irlandzkiga
islandzkiis
japońskija
jidyszyi
jorubayo
kannadakn
kaszmirskiks
katalońskica
kazachskikk
keczuaqu
khmerskikm
kikujuki
kinya-ruandarw
kirgiskiky
koreańskiko
kornijskikw
laotańskilo
lapoński północnyse
lingalaln
litewskilt
luba-katangalu
luksemburskilb
łotewskilv
macedońskimk
malajalamml
malajskims
malgaskimg
maltańskimt
manxgv
marathimr
mongolskimn
ndebele północnynd
nepalskine
niderlandzkinl
niemieckide
norweskino
orijaor
ormiańskihy
oromskiom
osetyjskios
pasztops
pendżabskipa
perskifa
polskipl
portugalskipt
retoromańskirm
rosyjskiru
rumuńskiro
rundirn
sangosg
serbskisr
serbsko-chorwackish
słowackisk
słoweńskisl
somalijskiso
suahilisw
syczuańskiii
syngaleskisi
szkocki gaelickigd
szonasn
szwedzkisv
tagalskitl
tajskith
tamilskita
telugute
tigriniati
tongato
tureckitr
tybetańskibo
ujgurskiug
ukraińskiuk
urduur
uzbeckiuz
walijskicy
węgierskihu
wietnamskivi
włoskiit
zachodniofryzyjskify
zuluzu

Więcej kodów języków można znaleźć w standardzie ISO 639.

Odmiany języków

Niektóre języki tak mocno upowszechniły się na świecie, że występują na terenie wielu odrębnych obszarów. Jednak odmiana tego samego języka w każdym z takich obszarów może się nieco różnić jeżeli chodzi o wymowę, akcent, zapis, a nawet niektóre słowa. Na przykład mieszkańcy Stanów Zjednoczonych zrozumieją się z Brytyjczykami, jednak aby uniknąć jakichkolwiek nieporozumień, często obie odmiany języka angielskiego oznacza się w odrębny sposób - odpowiednio: en-US i en-GB.

Chociaż pierwszy człon nazwy kodowej odmiany języka zwyczajowo piszemy małymi literami, a drugi - wielkimi literami, taka konwencja nie jest jednak absolutnie wymagana. Na przykład czasami spotyka się oba człony pisane w całości małymi literami.

Wykaz odmian języków
JęzykObszarSkrót
afrikaansNamibiaaf-NA
afrikaansRepublika Południowej Afrykiaf-ZA
albańskiAlbaniasq-AL
albańskiKosowosq-XK
albańskiMacedoniasq-MK
angielskiAnguillaen-AI
angielskiAntigua i Barbudaen-AG
angielskiAustraliaen-AU
angielskiBahamyen-BS
angielskiBarbadosen-BB
angielskiBelgiaen-BE
angielskiBelizeen-BZ
angielskiBermudyen-BM
angielskiBotswanaen-BW
angielskiBrytyjskie Terytorium Oceanu Indyjskiegoen-IO
angielskiBrytyjskie Wyspy Dziewiczeen-VG
angielskiDalekie Wyspy Mniejsze Stanów Zjednoczonychen-UM
angielskiDiego Garciaen-DG
angielskiDominikaen-DM
angielskiErytreaen-ER
angielskiFalklandyen-FK
angielskiFidżien-FJ
angielskiFilipinyen-PH
angielskiGambiaen-GM
angielskiGhanaen-GH
angielskiGibraltaren-GI
angielskiGrenadaen-GD
angielskiGuamen-GU
angielskiGujanaen-GY
angielskiIndieen-IN
angielskiIrlandiaen-IE
angielskiJamajkaen-JM
angielskiKajmanyen-KY
angielskiKamerunen-CM
angielskiKanadaen-CA
angielskiKeniaen-KE
angielskiKiribatien-KI
angielskiLesothoen-LS
angielskiLiberiaen-LR
angielskiMadagaskaren-MG
angielskiMalawien-MW
angielskiMalezjaen-MY
angielskiMaltaen-MT
angielskiMariany Północneen-MP
angielskiMauritiusen-MU
angielskiMikronezjaen-FM
angielskiMontserraten-MS
angielskiNamibiaen-NA
angielskiNauruen-NR
angielskiNigeriaen-NG
angielskiNiueen-NU
angielskiNorfolken-NF
angielskiNowa Zelandiaen-NZ
angielskiPakistanen-PK
angielskiPalauen-PW
angielskiPapua-Nowa Gwineaen-PG
angielskiPitcairnen-PN
angielskiPortorykoen-PR
angielskiRepublika Południowej Afrykien-ZA
angielskiRwandaen-RW
angielskiSaint Kitts i Nevisen-KN
angielskiSaint Luciaen-LC
angielskiSaint Vincent i Grenadynyen-VC
angielskiSamoa Amerykańskieen-AS
angielskiSamoaen-WS
angielskiSeszeleen-SC
angielskiSierra Leoneen-SL
angielskiSingapuren-SG
angielskiSint Maartenen-SX
angielskiSRA Hongkong (Chiny)en-HK
angielskiSRA Makau (Chiny)en-MO
angielskiStany Zjednoczoneen-US
angielskiSuazien-SZ
angielskiSudan Południowyen-SS
angielskiSudanen-SD
angielskiTanzaniaen-TZ
angielskiTokelauen-TK
angielskiTongaen-TO
angielskiTrynidad i Tobagoen-TT
angielskiTurks i Caicosen-TC
angielskiTuvaluen-TV
angielskiUgandaen-UG
angielskiVanuatuen-VU
angielskiWielka Brytaniaen-GB
angielskiWyspa Bożego Narodzeniaen-CX
angielskiWyspa Guernseyen-GG
angielskiWyspa Jerseyen-JE
angielskiWyspa Manen-IM
angielskiWyspa Świętej Helenyen-SH
angielskiWyspy Cookaen-CK
angielskiWyspy Dziewicze Stanów Zjednoczonychen-VI
angielskiWyspy Kokosoween-CC
angielskiWyspy Marshallaen-MH
angielskiWyspy Salomonaen-SB
angielskiZambiaen-ZM
angielskiZimbabween-ZW
arabskiAlgieriaar-DZ
arabskiArabia Saudyjskaar-SA
arabskiBahrajnar-BH
arabskiCzadar-TD
arabskiDżibutiar-DJ
arabskiEgiptar-EG
arabskiErytreaar-ER
arabskiIrakar-IQ
arabskiIzraelar-IL
arabskiJemenar-YE
arabskiJordaniaar-JO
arabskiKatarar-QA
arabskiKomoryar-KM
arabskiKuwejtar-KW
arabskiLibanar-LB
arabskiLibiaar-LY
arabskiMarokoar-MA
arabskiMauretaniaar-MR
arabskiOmanar-OM
arabskiSahara Zachodniaar-EH
arabskiSomaliaar-SO
arabskiSudan Południowyar-SS
arabskiSudanar-SD
arabskiSyriaar-SY
arabskiTerytoria Palestyńskiear-PS
arabskiTunezjaar-TN
arabskiZjednoczone Emiraty Arabskiear-AE
bengalskiBangladeszbn-BD
bengalskiIndiebn-IN
chińskiChinyzh-CN
chińskiSingapurzh-SG
chińskiSRA Hongkong (Chiny)zh-HK
chińskiSRA Makau (Chiny)zh-MO
chińskiTajwanzh-TW
chorwackiBośnia i Hercegowinahr-BA
chorwackiChorwacjahr-HR
duńskiDaniada-DK
duńskiGrenlandiada-GL
eweGhanaee-GH
eweTogoee-TG
francuskiAlgieriafr-DZ
francuskiBelgiafr-BE
francuskiBeninfr-BJ
francuskiBurkina Fasofr-BF
francuskiBurundifr-BI
francuskiCôte d’Ivoirefr-CI
francuskiCzadfr-TD
francuskiDemokratyczna Republika Kongafr-CD
francuskiDżibutifr-DJ
francuskiFrancjafr-FR
francuskiGabonfr-GA
francuskiGujana Francuskafr-GF
francuskiGwadelupafr-GP
francuskiGwinea Równikowafr-GQ
francuskiGwineafr-GN
francuskiHaitifr-HT
francuskiKamerunfr-CM
francuskiKanadafr-CA
francuskiKomoryfr-KM
francuskiKongofr-CG
francuskiLuksemburgfr-LU
francuskiMadagaskarfr-MG
francuskiMajottafr-YT
francuskiMalifr-ML
francuskiMarokofr-MA
francuskiMartynikafr-MQ
francuskiMauretaniafr-MR
francuskiMauritiusfr-MU
francuskiMonakofr-MC
francuskiNigerfr-NE
francuskiNowa Kaledoniafr-NC
francuskiPolinezja Francuskafr-PF
francuskiRepublika Środkowoafrykańskafr-CF
francuskiReunionfr-RE
francuskiRwandafr-RW
francuskiSaint-Barthélemyfr-BL
francuskiSaint-Martinfr-MF
francuskiSaint-Pierre i Miquelonfr-PM
francuskiSenegalfr-SN
francuskiSeszelefr-SC
francuskiSyriafr-SY
francuskiSzwajcariafr-CH
francuskiTogofr-TG
francuskiTunezjafr-TN
francuskiVanuatufr-VU
francuskiWallis i Futunafr-WF
fulaniGwineaff-GN
fulaniKamerunff-CM
fulaniMauretaniaff-MR
fulaniSenegalff-SN
greckiCyprel-CY
greckiGrecjael-GR
hausaGhanaha-GH
hausaNigerha-NE
hausaNigeriaha-NG
hiszpańskiArgentynaes-AR
hiszpańskiBoliwiaes-BO
hiszpańskiCeuta i Melillaes-EA
hiszpańskiChilees-CL
hiszpańskiDominikanaes-DO
hiszpańskiEkwadores-EC
hiszpańskiFilipinyes-PH
hiszpańskiGwatemalaes-GT
hiszpańskiGwinea Równikowaes-GQ
hiszpańskiHiszpaniaes-ES
hiszpańskiHondurases-HN
hiszpańskiKolumbiaes-CO
hiszpańskiKostarykaes-CR
hiszpańskiKubaes-CU
hiszpańskiMeksykes-MX
hiszpańskiNikaraguaes-NI
hiszpańskiPanamaes-PA
hiszpańskiParagwajes-PY
hiszpańskiPerues-PE
hiszpańskiPortorykoes-PR
hiszpańskiSalwadores-SV
hiszpańskiStany Zjednoczonees-US
hiszpańskiUrugwajes-UY
hiszpańskiWenezuelaes-VE
hiszpańskiWyspy Kanaryjskiees-IC
jorubaBeninyo-BJ
jorubaNigeriayo-NG
katalońskiAndoraca-AD
katalońskiFrancjaca-FR
katalońskiHiszpaniaca-ES
katalońskiWłochyca-IT
keczuaBoliwiaqu-BO
keczuaEkwadorqu-EC
keczuaPeruqu-PE
koreańskiKorea Południowako-KR
koreańskiKorea Północnako-KP
lapoński północnyFinlandiase-FI
lapoński północnyNorwegiase-NO
lapoński północnySzwecjase-SE
lingalaAngolaln-AO
lingalaDemokratyczna Republika Kongaln-CD
lingalaKongoln-CG
lingalaRepublika Środkowoafrykańskaln-CF
malajskiBrunei Darussalamms-BN
malajskiMalezjams-MY
malajskiSingapurms-SG
nepalskiIndiene-IN
nepalskiNepalne-NP
niderlandzkiArubanl-AW
niderlandzkiBelgianl-BE
niderlandzkiCuraçaonl-CW
niderlandzkiHolandianl-NL
niderlandzkiNiderlandy Karaibskienl-BQ
niderlandzkiSint Maartennl-SX
niderlandzkiSurinamnl-SR
niemieckiAustriade-AT
niemieckiBelgiade-BE
niemieckiLiechtensteinde-LI
niemieckiLuksemburgde-LU
niemieckiNiemcyde-DE
niemieckiSzwajcariade-CH
norweskibokmålnb
norweskiNorwegianb-NO
norweskinynorsknn
norweskiSvalbard i Jan Mayennb-SJ
oromskiEtiopiaom-ET
oromskiKeniaom-KE
osetyjskiGruzjaos-GE
osetyjskiRosjaos-RU
pendżabskiIndiepa-IN
pendżabskiPakistanpa-PK
perskiAfganistanfa-AF
perskiIranfa-IR
portugalskiAngolapt-AO
portugalskiBrazyliapt-BR
portugalskiGwinea Bissaupt-GW
portugalskiMozambikpt-MZ
portugalskiPortugaliapt-PT
portugalskiRepublika Zielonego Przylądkapt-CV
portugalskiSRA Makau (Chiny)pt-MO
portugalskiTimor Wschodnipt-TL
portugalskiWyspy Świętego Tomasza i Książęcapt-ST
rosyjskiBiałoruśru-BY
rosyjskiKazachstanru-KZ
rosyjskiKirgistanru-KG
rosyjskiMołdawiaru-MD
rosyjskiRosjaru-RU
rosyjskiUkrainaru-UA
rumuńskiMołdawiaro-MD
rumuńskiRumuniaro-RO
serbskiBośnia i Hercegowinasr-BA
serbskiCzarnogórasr-ME
serbskiKosowosr-XK
serbskiSerbiasr-RS
somalijskiDżibutiso-DJ
somalijskiEtiopiaso-ET
somalijskiKeniaso-KE
somalijskiSomaliaso-SO
suahiliKeniasw-KE
suahiliTanzaniasw-TZ
suahiliUgandasw-UG
szwedzkiFinlandiasv-FI
szwedzkiSzwecjasv-SE
szwedzkiWyspy Alandzkiesv-AX
tamilskiIndieta-IN
tamilskiMalezjata-MY
tamilskiSingapurta-SG
tamilskiSri Lankata-LK
tigriniaErytreati-ER
tigriniaEtiopiati-ET
tureckiCyprtr-CY
tureckiTurcjatr-TR
tybetańskiChinybo-CN
tybetańskiIndiebo-IN
urduIndieur-IN
urduPakistanur-PK
uzbeckiAfganistanuz-AF
uzbeckiUzbekistanuz-UZ
włoskiSan Marinoit-SM
włoskiSzwajcariait-CH
włoskiWłochyit-IT

Więcej kodów krajów można znaleźć w standardzie ISO 3166-1.

Strony kodowe

UTF

W 1993 roku została opracowana specjalna strona kodowa tzw. Unicode. Jest to standard 16-bitowy i dzięki temu może zapisać aż 65536 znaków. Pozwala to umieścić w jednej stronie kodowej większość alfabetów świata, co sprawia, że jest to jedyny standard, umożliwiający pisanie dokumentów w wielu językach jednocześnie. Niestety pliki takie mogą mieć nawet dwa razy większe rozmiary (przy stronie kodowej UTF-16), choć jeśli chodzi o polskie teksty zapisane w powszechnie używanej stronie kodowej UTF-8, implementującej standard Unicode, powiększenie pliku nie jest duże. Dodatkowo znaki Unicode nie zawsze są poprawnie wyświetlane (jeśli np. użytkownik nie posiada odpowiedniej czcionki Unicode), chociaż z tym jest już coraz lepiej i dzisiaj praktycznie nie stanowi to już problemu. Aby zapisywać znaki za pomocą Unicode, trzeba się zaopatrzyć w edytor, który go obsługuje. Wtedy należy również bezwzględnie pamiętać o wstawieniu w nagłówku dokumentu deklaracji strony kodowej Unicode:

<meta charset="utf-8">
Wygląd znaków Unicode możesz sprawdzić tutaj.

ISO

Zamiast kodowania ISO zaleca się zawsze używać stronę kodową UTF, która automatycznie obsługuje większość języków świata. Natomiast wszystkie strony kodowe WINDOWS są mocno odradzane!

Jeśli chcemy napisać dokument w określonym języku (innym niż rodzimy) i z jakiegoś powodu nie możemy używać zalecanej strony kodowej UTF, musimy się do tego odpowiednio przygotować:

  1. Pobrać i zainstalować w systemie czcionkę ekranową (zaleca się standard ISO), która dysponuje zestawem znaków, odpowiednim dla wybranego języka - jeśli jeszcze takiej nie posiadasz. Aby to zrobić, zwykle w ustawieniach systemu operacyjnego trzeba znaleźć sekcję zatytułowaną Czcionki i w niej użyć opcji dodawania nowej czcionki, odszukując jej plik na dysku komputera. Teraz wystarczy w używanym przez nas edytorze HTML, ustawić dodaną właśnie czcionkę jako ekranową.
  2. Dodać nowy układ klawiatury w systemie - ta opcja zwykle jest dostępna w ustawieniach systemu operacyjnego pod sekcją zatytułowaną Języki. Dodatkowo czasami przydatna może być również opcja Przełącznik języków, dzięki której można się będzie płynnie przełączać pomiędzy różnymi językami, które zostały dodane w systemie.
  3. Zadeklarować w treści nagłówkowej dokumentu - wewnątrz HEAD [zobacz: Ramy dokumentu] odpowiednią stronę kodową:
    <meta charset="strona kodowa">
    gdzie wyrażenie "strona kodowa" oznacza kod wybranego kodowania znaków (zgodnie z językiem), np. iso-8859-2.
    Różne 8-bitowe strony kodowe możesz znaleźć w tabeli poniżej. Mocno odradza się stosowanie tych w standardzie Windows. Obsługują go tylko przeglądarki w systemie MS Windows. Jeśli użytkownik będzie posiadał inny system operacyjny, prawie na pewno spowoduje to pojawienie się u niego na ekranie zupełnie nieprzewidzianych znaków! Czy chcesz, aby Twoja strona WWW wyglądała nieprofesjonalnie?

Strony kodowe

Strona kodowaNazwaJęzyki
iso-8859-1
windows-1252
zachodnioeuropejskiafrykanerski (af), albański (sq), baskijski (eu), kataloński (ca), duński (da), niderlandzki (nl), angielski (en), fareski (fo), fiński (fi), francuski (fr), galicyjski (gl), niemiecki (de), islandzki (is), irlandzki (ir), włoski (it), norweski (no), portugalski (pt), szkocki (gd), hiszpański (es), szwedzki (sv)
iso-8859-2
windows-1250
środkowoeuropejskichorwacki (hr), czeski (cs), węgierski (hu), polski (pl), rumuński (ro), serbski (sr), słowacki (sk), słoweński (sl)
iso-8859-3południowoeuropejskiesperanto (eo), maltański (mt)
iso-8859-4
windows-1257
północnoeuropejskiestoński (et), łotewski (lv), litewski (lt), grenlandzki (kr), lapoński
iso-8859-5
windows-1251
cyrylicznybułgarski (bg), białoruski (be), macedoński (mk), rosyjsji (ru), serbski (sr), ukraiński (uk)
iso-8859-6
windows-1256
arabskiarabski (ar)
iso-8859-7
windows-1253
greckigrecki (el)
iso-8859-8
windows-1255
hebrajskihebrajski (iw)
iso-8859-9
windows-1254
tureckiturecki (tr)
iso-8859-10skandynawski (nordycki)eskimoski, lapoński
iso-8859-11
windows-874
tajskitajski (th)
iso-8859-13
windows-1257
bałtyckiłotewski (lv), litewski (lt)
iso-8859-14celtyckiszkocki gaelicki, walijski, bretoński
windows-1258wietnamskiwietnamski (vi)

Więcej na ten temat można znaleźć w Wikipedii: ISO 8859, Strony kodowe Windows.

Dla zainteresowanych

Co to właściwie jest ta strona kodowa i dlaczego są z nią takie kłopoty? Jak wiadomo komputer jest bardzo głupi (tak, tak... Twój także :-)) - rozpoznaje tylko dwie cyfry: 0 i 1. Za pomocą różnych kombinacji tych właśnie cyfr, są zapisywane w komputerze wszystkie dane, również znaki alfabetu, np. literze "A" może odpowiadać kombinacja 1000001, "B" - 1000010 itd. Jest oczywiste, że musi istnieć jakiś standard, który powie niemądrej maszynie, które kombinacje zer i jedynek, odpowiadają jakim literom. Taki standard jest nazywany właśnie stroną kodową.

Większość stron kodowych wywodzi się z opracowanego w Ameryce (w zamierzchłych czasach) standardu ASCII - American Standards Committee for Information Interchange. Każda litera była w nim zapisana za pomocą kombinacji siedmiu zer i jedynek; potem rozszerzono zapis do ośmiu (8 bitów = 1 bajt). Jak łatwo obliczyć, w ten sposób można zakodować tylko 256 znaków. Ponieważ wszystkie pozycje zostały już zajęte przez angielskie litery oraz znaki kontrolne, dlatego konieczne okazało się opracowanie dodatkowych stron kodowych dla innych języków.

Nie byłoby żadnego problemu, gdyby istniał jeden uznawany międzynarodowo standard tworzenia stron kodowych. Teoretycznie był nim ISO, lecz niestety wielkie firmy komputerowe zaczęły opracowywać swoje własne strony (posiada je m.in. Windows oraz Macintosh; jedynie Linux posługuje się standardem ISO). Kłopoty zaczęły się wraz z rozwojem Internetu. Wcześniej nie miało znaczenia, jaki system kodowania był interpretowany na danej maszynie. Dzisiaj, kiedy do sieci można podłączyć komputer z niemal każdym systemem operacyjnym, często występuje problem niekompatybilności różnych stron kodowych. Dlatego nigdy nie należy zapominać o wstawieniu deklaracji kodowania w każdym z dokumentów HTML - powinna to być deklaracja ISO. Jednak sama deklaracja to nie wszystko. Oprócz niej konieczne jest używanie edytora HTML, który potrafi odpowiednio kodować znaki. W systemie Windows, zwykłe edytory tekstu zapisują znaki, korzystając oczywiście ze strony kodowej WINDOWS, dlatego nie można ich używać do pisania stron WWW kodowanych w ISO.

Facebook