Języki

Skróty nazw języków

W tabeli poniżej znajdziesz skróty literowe nazw języków, które mają zastosowanie podczas definiowania języka, w którym napisana jest strona oraz jako wartość atrybutu lang="...", wskazującego język pojedynczego elementu strony.

Kody języków mogą być jednoczłonowe lub dwuczłonowe. Pierwszy człon wskazuje zawsze język mówiony. Drugi człon może wskazywać kraj. Na przykład en oznacza ogólny język angielski, a en-us język angielski, jakim mówi się w Stanach Zjednoczonych.

JęzykSkrót
afrykanerskiaf
albańskisq
angielskien
angielski (Australia)en-au
angielski (Belize)en-bz
angielski (Irlandia)en-ie
angielski (Jamajka)en-jm
angielski (Kanada)en-ca
angielski (Nowa Zelandia)en-nz
angielski (Rep. Płd. Afryki)en-za
angielski (Stany Zjednoczone)en-us
angielski (Trynidad)en-tt
angielski (Wielka Brytania)en-gb
arabskiar
arabski (Algieria)ar-dz
arabski (Arabia Saudyjska)ar-sa
arabski (Bahrajn)ar-bh
arabski (Egipt)ar-eg
arabski (Irak)ar-iq
arabski (Jemen)ar-ye
arabski (Jordan)ar-jo
arabski (Katar)ar-qa
arabski (Kuwejt)ar-kw
arabski (Liban)ar-lb
arabski (Libia)ar-ly
arabski (Maroko)ar-ma
arabski (Oman)ar-om
arabski (Syria)ar-sy
arabski (Tunezja)ar-tn
arabski (Zjed. Emiraty Arabskie)ar-ae
baskijskieu
białoruskibe
bułgarskibg
chińskizh
chiński (Chiny)zh-cn
chiński (Hong Kong)zh-hk
chiński (Singapur)zh-sg
chiński (Tajwan)zh-tw
chorwackihrv
czeskics
duńskida
estońskiet
farerskifo
fińskifi
francuskifr
francuski (Belgia)fr-be
francuski (Kanada)fr-ca
francuski (Luksemburg)fr-lu
francuski (Szwajcaria)fr-ch
gaelickigd
greckiel
hebrajskihe
hindihi
hiszpańskies
hiszpański (Argentyna)es-ar
hiszpański (Boliwia)es-bo
hiszpański (Chile)es-cl
hiszpański (Dominikana)es-do
hiszpański (Ekwador)es-ec
hiszpański (Gwatemala)es-gt
hiszpański (Honduras)es-hn
hiszpański (Kolumbia)es-co
hiszpański (Kostaryka)es-cr
hiszpański (Meksyk)es-mx
hiszpański (Nikaragua)es-ni
hiszpański (Panama)es-pa
hiszpański (Paragwaj)es-py
hiszpański (Peru)es-pe
hiszpański (Puerto Rico)es-pr
hiszpański (Salwador)es-sv
hiszpański (Urugwaj)es-uy
hiszpański (Wenezuela)es-ve
indonezyjskiin
islandzkiis
japońskija
jidyszji
katalońskica
koreańskiko
litewskilt
łotewskilv
macedońskimk
malezyjskims
maltańskimt
niderlandzkinl
niderlandzki (Belgia)nl-be
niemieckide
niemiecki (Austria)de-at
niemiecki (Liechtenstein)de-li
niemiecki (Luksemburg)de-lu
niemiecki (Szwajcaria)de-ch
norweskinov
perski (Farsi)fa
polskipl
portugalskipt
portugalski (Brazylia)pt-br
retoromańskirm
rosyjskiru
rosyjski (Mołdawia)ru-mo
rumuńskiro
rumuński (Mołdawia)ro-mo
serbskisr
sutusx
szwedzkisv
szwedzki (Finlandia)sv-fi
słowackisk
słoweńskisl
tajlandzkith
tsongats
tswanatn
tureckitr
ukraińskiuk
urduur
wietnamskivi
włoskiit
włoski (Szwajcaria)it-ch
węgierskihu
xhosaxh
zuluskizu

Więcej kodów języków można znaleźć w standardzie ISO 639. Natomiast kody krajów opisane są w ISO 3166-1. W obu przypadkach należy brać po uwagę tylko dwuliterowe skróty.

Strony kodowe

UTF

W 1993 roku została opracowana specjalna strona kodowa tzw. Unicode. Jest to standard 16-bitowy i dzięki temu może zapisać aż 65536 znaków. Pozwala to umieścić w jednej stronie kodowej większość alfabetów świata, co sprawia, że jest to jedyny standard, umożliwiający pisanie dokumentów w wielu językach jednocześnie. Niestety pliki takie mogą mieć nawet dwa razy większe rozmiary (przy stronie kodowej UTF-16), choć jeśli chodzi o polskie teksty zapisane w powszechnie używanej stronie kodowej UTF-8, implementującej standard Unicode, powiększenie pliku nie jest duże. Dodatkowo znaki Unicode nie zawsze są poprawnie wyświetlane (jeśli np. użytkownik nie posiada odpowiedniej czcionki Unicode), chociaż z tym jest już coraz lepiej i dzisiaj praktycznie nie stanowi to już problemu. Aby zapisywać znaki za pomocą Unicode, trzeba się zaopatrzyć w edytor, który go obsługuje. Wtedy należy również bezwzględnie pamiętać o wstawieniu w nagłówku dokumentu deklaracji strony kodowej Unicode:

<meta charset="utf-8">

Wygląd znaków Unicode możesz sprawdzić tutaj.

ISO

Zamiast kodowania ISO zaleca się zawsze używać stronę kodową UTF, która automatycznie obsługuje większość języków świata. Natomiast wszystkie strony kodowe WINDOWS są mocno odradzane!

Jeśli chcemy napisać dokument w określonym języku (innym niż rodzimy), należy:

  1. Pobrać i zainstalować w systemie czcionkę ekranową (zaleca się standard ISO), która dysponuje zestawem znaków, odpowiednim dla wybranego języka (jeśli jeszcze takiej nie posiadasz). Aby zainstalować nową czcionkę, należy wybrać:
    Menu Start/Ustawienia/Panel sterowania/Czcionki/Plik/Zainstaluj nową czcionkę...,
    a następnie odszukać czcionkę na dysku i kliknąć OK. Teraz wystarczy w używanym przez nas edytorze HTML, ustawić dodaną właśnie czcionkę jako ekranową.
  2. Wybrać odpowiedni układ klawiatury w systemie, czyli:
    Menu Start/Ustawienia/Panel sterowania/Klawiatura/Język/Dodaj (Windows 98)
    lub
    Menu Start/(Ustawienia)/Panel sterowania/Opcje regionalne i językowe/Języki/Szczegóły.../Dodaj... (Windows XP)
    i ustawić żądany język, a następnie zaznaczyć opcję: Przełącznik języków: Lewy Alt+Shift lub Przełącznik języków: Ctrl+Shift oraz Włączaj wskaźnik na pasku zadań (Windows 98) albo: Ustawienia klawiszy.../Zmień sekwencję klawiszy.../Przełącz języki (Windows XP). Teraz można przełączać się pomiędzy różnymi językami, które zostały dodane, za pomocą klawiszy: Lewy Alt+Shift lub Ctrl+Shift (w zależności od wyboru), a skrót nazwy aktualnegojęzyka pojawi się na pasku zadań systemu (tam gdzie zegar).
  3. Zadeklarować w treści nagłówkowej dokumentu - wewnątrz HEAD [zobacz: Ramy dokumentu] odpowiednią stronę kodową:
    <meta charset="strona kodowa">
    gdzie wyrażenie "strona kodowa" oznacza kod wybranego kodowania znaków (zgodnie z językiem), np. iso-8859-2.
    Różne strony kodowe możesz znaleźć w tabeli poniżej. Mocno zaleca się stosowanie standardu ISO. Stronę kodową Windows obsługują tylko przeglądarki w systemie MS Windows - jeśli użytkownik będzie posiadał inny system operacyjny, prawie na pewno spowoduje to pojawienie się u niego na ekranie zupełnie nieprzewidzianych znaków! Czy chcesz, aby Twoja strona WWW wyglądała nieprofesjonalnie?

Strony kodowe

Strona kodowaNazwaJęzyki
iso-8859-1
windows-1252
zachodnioeuropejskiafrykanerski (af), albański (sq), baskijski (eu), kataloński (ca), duński (da), niderlandzki (nl), angielski (en), fareski (fo), fiński (fi), francuski (fr), galicyjski (gl), niemiecki (de), islandzki (is), irlandzki (ir), włoski (it), norweski (no), portugalski (pt), szkocki (gd), hiszpański (es), szwedzki (sv)
iso-8859-2
windows-1250
środkowoeuropejskichorwacki (hr), czeski (cs), węgierski (hu), polski (pl), rumuński (ro), serbski (sr), słowacki (sk), słoweński (sl)
iso-8859-3południowoeuropejskiesperanto (eo), maltański (mt)
iso-8859-4
windows-1257
północnoeuropejskiestoński (et), łotewski (lv), litewski (lt), grenlandzki (kr), lapoński
iso-8859-5
windows-1251
cyrylicznybułgarski (bg), białoruski (be), macedoński (mk), rosyjsji (ru), serbski (sr), ukraiński (uk)
iso-8859-6
windows-1256
arabskiarabski (ar)
iso-8859-7
windows-1253
greckigrecki (el)
iso-8859-8
windows-1255
hebrajskihebrajski (iw)
iso-8859-9
windows-1254
tureckiturecki (tr)
iso-8859-10skandynawski (nordycki)eskimoski, lapoński
iso-8859-11
windows-874
tajskitajski (th)
iso-8859-13
windows-1257
bałtyckiłotewski (lv), litewski (lt)
iso-8859-14celtyckiszkocki gaelicki, walijski, bretoński
windows-1258wietnamskiwietnamski (vi)

Więcej na ten temat można znaleźć w Wikipedii: ISO 8859, Strony kodowe Windows.

Dla zainteresowanych

Co to właściwie jest ta strona kodowa i dlaczego są z nią takie kłopoty? Jak wiadomo komputer jest bardzo głupi (tak, tak... Twój także :-) - rozpoznaje tylko dwie cyfry: 0 i 1. Za pomocą różnych kombinacji tych właśnie cyfr, są zapisywane w komputerze wszystkie dane, również znaki alfabetu, np. literze "A" może odpowiadać kombinacja 1000001, "B" - 1000010 itd. Jest oczywiste, że musi istnieć jakiś standard, który powie niemądrej maszynie, które kombinacje zer i jedynek, odpowiadają jakim literom. Taki standard jest nazywany właśnie stroną kodową.

Większość stron kodowych wywodzi się z opracowanego w Ameryce (w zamierzchłych czasach) standardu ASCII - American Standards Committee for Information Interchange. Każda litera była w nim zapisana za pomocą kombinacji siedmiu zer i jedynek; potem rozszerzono zapis do ośmiu (8 bitów = 1 bajt). Jak łatwo obliczyć, w ten sposób można zakodować tylko 256 znaków. Ponieważ wszystkie pozycje zostały już zajęte przez angielskie litery oraz znaki kontrolne, dlatego konieczne okazało się opracowanie dodatkowych stron kodowych dla innych języków.

Nie byłoby żadnego problemu, gdyby istniał jeden uznawany międzynarodowo standard tworzenia stron kodowych. Teoretycznie był nim ISO, lecz niestety wielkie firmy komputerowe zaczęły opracowywać swoje własne strony (posiada je m.in. Windows oraz Macintosh; jedynie Linux posługuje się standardem ISO). Kłopoty zaczęły się wraz z rozwojem Internetu. Wcześniej nie miało znaczenia, jaki system kodowania był interpretowany na danej maszynie. Dzisiaj, kiedy do sieci można podłączyć komputer z niemal każdym systemem operacyjnym, często występuje problem niekompatybilności różnych stron kodowych. Dlatego nigdy nie należy zapominać o wstawieniu deklaracji kodowania w każdym z dokumentów HTML - powinna to być deklaracja ISO. Jednak sama deklaracja to nie wszystko. Oprócz niej konieczne jest używanie edytora HTML, który potrafi odpowiednio kodować znaki. W systemie Windows, zwykłe edytory tekstu zapisują znaki, korzystając oczywiście ze strony kodowej WINDOWS, dlatego nie można ich używać do pisania stron WWW kodowanych w ISO.