Temat został już dawno poruszony, ale, jak widać JohnMu jest nadal męczony o to, co widać po dzisiejszym wpisie na Google+. Wydawało mi się, że wpis, o którym mówił, już kiedyś poruszałem, ale musiał się „zapodziać” – więc niniejszym „nadrabiam zaległości”. Poniżej streszczenie najważniejszych kwestii – każdego jednak zachęcam do przeczytania oryginału – wpisu na G+ oraz na blogu Google.
Najważniejsze – błędy 404 nie szkodzą stronie – niezależnie od tego, czy jest ich 10, czy … 10 milionów. Warto też wiedzieć, że ustawione są w Narzędziach według pewnej hierarchii (więcej o tym znajdziesz tutaj).
Czy błędy 404 widoczne w Narzędziach wpływają na ranking strony w Google
Strony zwracające błąd 404 są „całkowicie normalnym” elementem składowym Internetu. Sieć podlega nieustannym zmianom, pojawiają się nowe treści, stare – „wymierają” – a kiedy wymierają, to logiczną rzeczą jest, że przy próbie wejścia na stary adres pojawia się błąd 404. Przeglądarki doskonale o tym wiedzą (nawet Google w obrębie swojej witryny też ma strony, których „już nie ma”).
Google preferuje, aby w sytuacji, gdy pozbywamy się pewnej strony z serwisu, przy próbie wejścia na jej adres zwracany był kod 404 (lub 410) – zamiast tzw. miękkiego 404 – kiedy strona 404 zwraca kod nie 404(410), a 200… Należy pamiętać, że aby doszło do w/w sytuacji strony nie mogą być zablokowane przez robotami.
Zatem strony błędu 404 w ogóle nie wpływają negatywnie na moją stronę?
Niekoniecznie. Niekiedy jest tak, że strony błędu 404, jak to je widzi Google, w rzeczywistości są … stronami, na których nam zależy. W takiej sytuacji musimy jako webmasterzy sprawdzić, dlaczego Googlebot widzi 404 – a nie 200. Niekiedy widoczny błąd wynikać może z … literówki, jaką ktoś zrobił przy próbie podlinkowania naszej strony. Wtedy zamiast „zostawić błąd” należy użyć przekierowania 301, aby nie stracić ruchu, jaki jest generowany z błędnego odnośnika.
Niekiedy zaś wrzucając zmieniony plik na serwer zmieniliśmy przez przypadek w nim nazwę (miałem ostatnio taką sytuację)… Ogólnie warto nadzorować to, co Google nam serwuje w Narzędziach w tym dziale.
Dodatkowe informacje o tzw. miękkich stronach błędu 404
Taka sytuacja ma miejsce w sytuacji, gdy zwracany jest inny kod niż 404 (410) dla adresu url, który nie istnieje. Bardzo dobrym przykładem jest zwracanie kodu 200 dla użytecznych stron błędu 404 – taka sytuacja nie może mieć miejsca. Google nie zaleca też sytuacji, w której strona przekierowuje wszystkie nieznane urle na swoją stronę główną.
Zagrożenia? Możliwość złego zrozumienia, a w konsekwencji zindeksowania strony, która używa takich praktyk.
Both of these cases can have negative effects on our understanding and indexing of your site
Skąd mam wiedzieć, jaki kod ma zwracać dany url – 301/404/410?
Usuwając coś ze strony musimy zadać sobie pytanie – czy usuwamy to na stałe, czy przenosimy w inne miejsce. W pierwszym przypadku pojawi się kod 404(410), w drugim – 301.
Większość 404’k prowadzi do stron, których nie ma w obrębie serwisu. Dlaczego? Skąd się one biorą?
Jak Google znajdzie w Internecie odnośnik do naszej strony, to za nim podąża – i jeżeli nic nie znajdzie w obrębie naszego serwisu docelowego adresu, to rzeczą normalną jest, że w Narzędziach zwróci nam błąd 404. Błędy pojawiają się np. w wyniku pewnych problemów w obrębie źle zaprojektowanego CMSa, przy zmianie struktury adresów (zmieniając CMSa „zapominamy” o przekierowaniu starych adresów url na nowe); wystarczy też pomylić się przy umieszczaniu do kogoś odnośnika – i już mamy nowy 404.
Jeżeli w Narzędziach widać błędy 404, które nas nie dotyczą, jesteśmy pewni tego – spokojnie można je zignorować.
Ktoś ukradł mi contect, co spowodowało wzrost ilości błędów 404, ponieważ do oryginalnych adresów url podopisywano parametry, np „width=„
Generalnie nie ma powodów, aby przejmować się takimi sytuacjami. Jeżeli chcemy jednak sytuację „wyprostować” warto zobaczyć ten wpis na Forum Google. Oczywiście pamiętajmy o tym, aby złodziei treści zgłaszać przez odpowiedni formularz – to działa, a patrząc się na coraz większą ilość zgłoszeń coraz więcej webmasterów zaczyna korzystać z tego narzędzia.
Usunąłem wszystkie wykazane błędy, ale są one nadal widoczne w Narzędziach. Czy to oznacza, że nie poprawiłem ich właściwie? Po jakim czasie one znikną z Narzędzi?
Dane nie są odświeżane automatycznie. Popatrzmy też na datę wystąpienia problemu widoczną w Narzędziach – jeżeli jest ona sprzed daty jego naprawienia, to Google nie zdążyło po prostu jeszcze „przyjąć zmian do wiadomości”. Pozostaje nam uzbroić się w cierpliwość i poczekać na wizytę robota na problematycznych adresach. Warto także użyć funkcji „Pobierz jako Google” z Narzędzi dla kilku wybranych, naprawionych adresów. Jak wynik będzie pozytywny to spokojnie możemy czekac na znikanie błedów 404 z zestawienia.
Czy używać narzędzia Google do usuwania url do usunięcia błędów 404?
Nie. Narzędzie usuwa url z wyników wyszukiwania, nie z konta.
Po raz kolejny potwierdza się zasada, że najlepiej pracować nad własną stroną, zgodnie ze standardami internetowymi.