Przejdź do treści

Języki - HTML

Strony kodowe

UTF

W 1993 roku została opracowana specjalna strona kodowa tzw. Unicode. Jest to standard 16-bitowy i dzięki temu może zapisać aż 65536 znaków. Pozwala to umieścić w jednej stronie kodowej większość alfabetów świata, co sprawia, że jest to jedyny standard, umożliwiający pisanie dokumentów w wielu językach jednocześnie. Niestety pliki takie mogą mieć nawet dwa razy większe rozmiary (przy stronie kodowej UTF-16), choć jeśli chodzi o polskie teksty zapisane w powszechnie używanej stronie kodowej UTF-8, implementującej standard Unicode, powiększenie pliku nie jest duże. Dodatkowo znaki Unicode nie zawsze są poprawnie wyświetlane (jeśli np. użytkownik nie posiada odpowiedniej czcionki Unicode), chociaż z tym jest już coraz lepiej i dzisiaj praktycznie nie stanowi to już problemu. Aby zapisywać znaki za pomocą Unicode, trzeba się zaopatrzyć w edytor, który go obsługuje. Wtedy należy również bezwzględnie pamiętać o wstawieniu w nagłówku dokumentu deklaracji strony kodowej Unicode:

<meta charset="utf-8">
Wygląd znaków Unicode możesz sprawdzić tutaj.

ISO

Zamiast kodowania ISO zaleca się zawsze używać stronę kodową UTF, która automatycznie obsługuje większość języków świata. Natomiast wszystkie strony kodowe WINDOWS są mocno odradzane!

Jeśli chcemy napisać dokument w określonym języku (innym niż rodzimy), należy:

  1. Pobrać i zainstalować w systemie czcionkę ekranową (zaleca się standard ISO), która dysponuje zestawem znaków, odpowiednim dla wybranego języka (jeśli jeszcze takiej nie posiadasz). Aby zainstalować nową czcionkę, należy wybrać:
    Menu Start/Ustawienia/Panel sterowania/Czcionki/Plik/Zainstaluj nową czcionkę...,
    a następnie odszukać czcionkę na dysku i kliknąć OK. Teraz wystarczy w używanym przez nas edytorze HTML, ustawić dodaną właśnie czcionkę jako ekranową.
  2. Wybrać odpowiedni układ klawiatury w systemie, czyli:
    Menu Start/Ustawienia/Panel sterowania/Klawiatura/Język/Dodaj (Windows 98)
    lub
    Menu Start/(Ustawienia)/Panel sterowania/Opcje regionalne i językowe/Języki/Szczegóły.../Dodaj... (Windows XP)
    i ustawić żądany język, a następnie zaznaczyć opcję: Przełącznik języków: Lewy Alt+Shift lub Przełącznik języków: Ctrl+Shift oraz Włączaj wskaźnik na pasku zadań (Windows 98) albo: Ustawienia klawiszy.../Zmień sekwencję klawiszy.../Przełącz języki (Windows XP). Teraz można przełączać się pomiędzy różnymi językami, które zostały dodane, za pomocą klawiszy: Lewy Alt+Shift lub Ctrl+Shift (w zależności od wyboru), a skrót nazwy aktualnegojęzyka pojawi się na pasku zadań systemu (tam gdzie zegar).
  3. Zadeklarować w treści nagłówkowej dokumentu - wewnątrz HEAD [zobacz: Ramy dokumentu] odpowiednią stronę kodową:
    <meta charset="strona kodowa">
    gdzie wyrażenie "strona kodowa" oznacza kod wybranego kodowania znaków (zgodnie z językiem), np. iso-8859-2.
    Różne strony kodowe możesz znaleźć w tabeli poniżej. Mocno zaleca się stosowanie standardu ISO. Stronę kodową Windows obsługują tylko przeglądarki w systemie MS Windows - jeśli użytkownik będzie posiadał inny system operacyjny, prawie na pewno spowoduje to pojawienie się u niego na ekranie zupełnie nieprzewidzianych znaków! Czy chcesz, aby Twoja strona WWW wyglądała nieprofesjonalnie?

Strony kodowe

Strona kodowaNazwaJęzyki
iso-8859-1
windows-1252
zachodnioeuropejskiafrykanerski (af), albański (sq), baskijski (eu), kataloński (ca), duński (da), niderlandzki (nl), angielski (en), fareski (fo), fiński (fi), francuski (fr), galicyjski (gl), niemiecki (de), islandzki (is), irlandzki (ir), włoski (it), norweski (no), portugalski (pt), szkocki (gd), hiszpański (es), szwedzki (sv)
iso-8859-2
windows-1250
środkowoeuropejskichorwacki (hr), czeski (cs), węgierski (hu), polski (pl), rumuński (ro), serbski (sr), słowacki (sk), słoweński (sl)
iso-8859-3południowoeuropejskiesperanto (eo), maltański (mt)
iso-8859-4
windows-1257
północnoeuropejskiestoński (et), łotewski (lv), litewski (lt), grenlandzki (kr), lapoński
iso-8859-5
windows-1251
cyrylicznybułgarski (bg), białoruski (be), macedoński (mk), rosyjsji (ru), serbski (sr), ukraiński (uk)
iso-8859-6
windows-1256
arabskiarabski (ar)
iso-8859-7
windows-1253
greckigrecki (el)
iso-8859-8
windows-1255
hebrajskihebrajski (iw)
iso-8859-9
windows-1254
tureckiturecki (tr)
iso-8859-10skandynawski (nordycki)eskimoski, lapoński
iso-8859-11
windows-874
tajskitajski (th)
iso-8859-13
windows-1257
bałtyckiłotewski (lv), litewski (lt)
iso-8859-14celtyckiszkocki gaelicki, walijski, bretoński
windows-1258wietnamskiwietnamski (vi)

Więcej na ten temat można znaleźć w Wikipedii: ISO 8859, Strony kodowe Windows.

Dla zainteresowanych

Co to właściwie jest ta strona kodowa i dlaczego są z nią takie kłopoty? Jak wiadomo komputer jest bardzo głupi (tak, tak... Twój także 🙂) - rozpoznaje tylko dwie cyfry: 0 i 1. Za pomocą różnych kombinacji tych właśnie cyfr, są zapisywane w komputerze wszystkie dane, również znaki alfabetu, np. literze "A" może odpowiadać kombinacja 1000001, "B" - 1000010 itd. Jest oczywiste, że musi istnieć jakiś standard, który powie niemądrej maszynie, które kombinacje zer i jedynek, odpowiadają jakim literom. Taki standard jest nazywany właśnie stroną kodową.

Większość stron kodowych wywodzi się z opracowanego w Ameryce (w zamierzchłych czasach) standardu ASCII - American Standards Committee for Information Interchange. Każda litera była w nim zapisana za pomocą kombinacji siedmiu zer i jedynek; potem rozszerzono zapis do ośmiu (8 bitów = 1 bajt). Jak łatwo obliczyć, w ten sposób można zakodować tylko 256 znaków. Ponieważ wszystkie pozycje zostały już zajęte przez angielskie litery oraz znaki kontrolne, dlatego konieczne okazało się opracowanie dodatkowych stron kodowych dla innych języków.

Nie byłoby żadnego problemu, gdyby istniał jeden uznawany międzynarodowo standard tworzenia stron kodowych. Teoretycznie był nim ISO, lecz niestety wielkie firmy komputerowe zaczęły opracowywać swoje własne strony (posiada je m.in. Windows oraz Macintosh; jedynie Linux posługuje się standardem ISO). Kłopoty zaczęły się wraz z rozwojem Internetu. Wcześniej nie miało znaczenia, jaki system kodowania był interpretowany na danej maszynie. Dzisiaj, kiedy do sieci można podłączyć komputer z niemal każdym systemem operacyjnym, często występuje problem niekompatybilności różnych stron kodowych. Dlatego nigdy nie należy zapominać o wstawieniu deklaracji kodowania w każdym z dokumentów HTML - powinna to być deklaracja ISO. Jednak sama deklaracja to nie wszystko. Oprócz niej konieczne jest używanie edytora HTML, który potrafi odpowiednio kodować znaki. W systemie Windows, zwykłe edytory tekstu zapisują znaki, korzystając oczywiście ze strony kodowej WINDOWS, dlatego nie można ich używać do pisania stron WWW kodowanych w ISO.

Facebook