Przejdź do treści

Nagłówek i treść - HTML

Strona kanoniczna <link "canonical">

W jaki sposób pozbyć się zduplikowanych (powielonych) stron z wyników wyszukiwania?

W niemal każdym serwisie internetowym zdarza się, że ta sama treść jest prezentowana na kilka sposobów, tzn. pod różnymi adresami URL:

  • specjalna wersja serwisu przystosowana dla urządzeń mobilnych (smartfony, tablety itp.)
  • osobne wersje artykułów przeznaczone do wydruku
  • dokumenty zawierające tę samą listę pozycji (produktów, wyników wyszukiwania, artykułów itp.), a jedynie posortowanych w inny sposób - np. artykuly.php?sortuj=data i artykuly.php?sortuj=alfabet
  • obszary witryny wymagające zalogowania użytkownika, kiedy w adresie jest przekazywany identyfikator sesji - np. index.php?PHPSESSID=0123456789abcdef0123456789abcdef lub index.php?sid=0123456789abcdef0123456789abcdef
  • linki prowadzące do tej samej strony mają różną postać:
    • jeśli domyślnym numerem strony artykułu będzie 1, to adres artykul.php?strona=1 może być równoważny artykul.php
    • podobnie kolejność parametrów adresu URL, podawanych po pytajniku i rozdzielonych znakami "&", zwykle nie ma znaczenia, tzn. adres artykul.php?id=1&strona=1 zwykle jest równoważny artykul.php?strona=1&id=1
    • nazwę pliku "index.htm", "index.html" czy "index.php" zwykle można pominąć podając adres strony, dlatego http://www.example.com/index.html jest równoważny http://www.example.com/

Teoretycznie nie powinno to przeszkadzać czytelnikom naszej witryny, jednak może stać się problemem w przypadku wyszukiwarek internetowych - takich jak np. Google. Roboty wyszukiwarek starają się eliminować duplikujące się treści ze swojej bazy zaindeksowanych stron. Oznacza to, że jeśli ta sama lub bardzo podobna treść występuje w Twoim serwisie pod kilkoma różnymi adresami URL, w wynikach wyszukiwania pojawi się tylko jedna jej wersja. Która? To zależy, którą robot indeksujący uzna za podstawową. Niestety to tyko automat dlatego może się mylić, uznając za wersję podstawową adres URL z wieloma niepotrzebnymi parametrami po pytajniku lub wersję artykułu przeznaczoną do wydruku. Może to potencjalnie obniżyć pozycję Twojej witryny w wynikach wyszukiwania oraz wywołać pewną dezorientację czytelnika, który trafił z wyszukiwarki do Twojego serwisu na niewłaściwą wersję dokumentu.

Istnieje jednak możliwość jasnego wskazania robotowi wyszukiwarki, która wersja strony jest tą podstawową - stroną kanoniczną. Aby to zrobić, na każdej wersji takiej strony, która różni się adresem URL od wersji podstawowej, należy podać bezpośredni adres prowadzący do wersji kanonicznej:

<head>
	<link rel="canonical" href="adres strony podstawowej">
</head>
gdzie jako "adres strony podstawowej" należy podać bezwzględny adres strony (rozpoczynający się od http:// lub https://), która ma być prezentowana w wynikach wyszukiwania.

W tym przypadku nie powinno się używać względnej ścieżki dostępu, ponieważ taki zapis może nie być prawidłowo zinterpretowany przez roboty indeksujące wyszukiwarek sieciowych.

Warto zwrócić uwagę, że nie należy w ten sposób oznaczać dokumentów, które nie stanowią jedynie innej wersji strony kanonicznej (podstawowej), ponieważ wywoła to tylko ich niepotrzebną eliminację z wyników wyszukiwania. Trzeba również mieć świadomość, że znacznik ten stanowi jedynie sugestię dla robota wyszukiwarki i może nie być wzięty pod uwagę, jeśli robot z innego powodu uzna, że w danej sytuacji takie oznaczenie strony kanonicznej nie będzie pożądane dla użytkownika korzystającego z wyszukiwarki.

Pytania i odpowiedzi <link "canonical">

Co to jest strona kanoniczna?

Jeżeli w serwisie internetowym ta sama lub bardzo podobna podstrona znajduje się pod kilkoma różnymi adresami, strona kanoniczna wskazuje na jej podstawową wersję. Najczęściej będzie to po prostu dokument z najkrótszym adresem. W wynikach wyszukiwania np. Google zwykle pojawi się właśnie tylko strona kanoniczna, a pozostałe jej duplikaty zostaną pominięte.

Jak oznaczyć stronę kanoniczną?

Oznaczenie strony kanonicznej nie jest obowiązkowe. Warto to jednak zrobić, jeśli w serwisie mamy zduplikowane dokumenty. W przeciwnym razie wyszukiwarka będzie się sama próbowała domyślić, która z wersji jest podstawowa - co nie zawsze może być zgodne z naszymi założeniami. Aby oznaczyć stronę kanoniczną, we wszystkich dokumentach z powtarzającą się treścią (z wyjątkiem strony, którą chcemy wskazać jako wersję podstawową), trzeba wstawić w nagłówku dokumentu - czyli w dowolnym miejscu wewnątrz elementu <head>...</head> - następujący znacznik: <link rel="canonical" href="adres strony podstawowej">. Na przykład jeśli w naszej witrynie zarówno pod adresem https://www.example.com/ jak i https://www.example.com/index.html znajduje się identyczna treść, w tym drugim dokumencie możemy dodać znacznik: <link rel="canonical" href="https://www.example.com/">.

Komentarze

Zobacz więcej komentarzy

Facebook