Spis treści
Indeksacja stron www
Zacznijmy może od wyjaśnienia, o czym w ogóle jest mowa w tym artykule? O co chodzi z ową stroną zeskanowaną, ale nie zaindeksowaną? Jeżeli wejdziemy do Search Console do sekcji indeksowanie, to zobaczymy, jak Google widzi naszą stronę, a dokładniej, które jej składowe są w indeksie, a które nie. To bardzo ważne, ponieważ jeżeli strona nie jest zaindeksowana, to Google nie pokaże jej wynikach wyszukiwania, a co za tym idzie, potencjalny klient nie wyjdzie na naszą stronę po wpisaniu danego zapytania i nie stanie się naszym klientem.
Dla wielu osób to sekcja skuteczność w Search Console jest tą, którą odwiedzają najczęściej i wcale im się nie dziwię, ponieważ analizowanie zapytań, na które następuje wejście na naszą stronę z wyników wyszukiwania, jest bardzo ważne. Pozwala nam zorientować się w sytuacji – co cieszy się zainteresowaniem, jakie zapytania wpisują nasi potencjalni klienci, a co za tym idzie, możemy doprowadzić do tego, aby optymalizując lepiej naszą stronę pod te zapytania, generowała nam większy ruch z wyników wyszukiwania. Moim zdaniem jednak to 2 sekcja. Indeksowanie jest najważniejsza, ponieważ jeżeli na naszą stronę nie będą wchodziły osoby z Google, to nie będziemy mieli co analizować. Dlatego też należy od czasu do czasu zalogować się do konsoli, odwiedzić sekcję indeksowanie i zobaczyć, jakie strony w obrębie naszego serwisu znajdują się w indeksie, a jakie nie. Bardzo mało osób robi tego typu analizę. Prawdopodobnie dlatego, że wiele osób wychodzi z założenia, że skoro wygrały do Search Console site mapy, czyli mówiąc w uproszczeniu zbiór stron, z których składa się ich witryna, to teraz wystarczy tylko chwilę poczekać, aby wszystkie składowe tej site mapy, czyli wszystkie strony naszego serwisu pojawiły się w wynikach wyszukiwania. To bardzo złe podejście. To nie jest tak, że jeżeli wygramy site mapy Google z automatu zaindeksuje wszystkie strony.
Ponieważ po pierwsze wyszukiwarka nie musi indeksować stron, które znajdują się w site mapie – ba, Google nie musi nawet odwiedzać site mapy, aby zobaczyć, jaką posiada zawartość, co się w niej znajduje, a po drugie – o tym, czy Google zainteresuje w ogóle zgłoszone strony w site mapie decydują inne czynniki, które sprawiają, że dana strona może być np. zeskanowana, ale nie za indeksowana.
Jakie to są czynniki?
Jest ich 3.
Przyjrzyjmy im się z bliska.
Wiek stron www
Czynnik pierwszy to wiek stron. Jest takie powiedzenie, że doświadczenie zdobywa się wraz z wiekiem i podobnie zachowuje się też Google, które nie jest skłonne indeksować zawartości nowych stron szybko i kompleksowo. Wyszukiwarka potrzebuje czasu, aby przekonać się, czy dana strona faktycznie zasługuje na to, aby zostać zaindeksowana, czy treści, jakie się na niej znajdują, są faktycznie wysokie jakości, są przydatne dla użytkownika. Ten stan rzeczy związany jest z poziomem tzw. crawl budgetu, czyli czasu, jaki może przeznaczyć robot indeksujący na pobyt na stronie oraz na jej zaindeksowanie. Im witryna jest młodsza, tym poziom crawl budgetu jest na niższym poziomie. Im strona starsza oraz im cieszy się większą popularnością, tym można powiedzieć, że robot indeksujący Google nie opuszczą jej, tylko chodzi sobie non stop i przemierza jej elementy, a co za tym idzie każda nowa treść czy każda zmiana, jaka się dokonuje w obrębie zawartości takiej strony bardzo szybko jest indeksowana przez wyszukiwarkę i pokazywana w wynikach wyszukiwania. Dlatego też jeżeli Twoja strona składa się z wielu elementów, to nie dziw się, że przez pewien czas – przez pierwsze kilka miesięcy co najmniej nie wszystkie jej elementy będą zaindeksowane. A o tym, czy będą zaindeksowane, decydują też 2 pozostałe czynniki.
Niska jakość prezentowanej treści
Google nie jest skłonne do tego, aby indeksować strony, które zawierają mało treści, w ogóle jej nie zawierają, albo też treść, jaka znajduje się na takiej stronie, jest bardzo niskiej jakości. Jest to ważne, zwłaszcza w dzisiejszych czasach, kiedy tak bardzo ekscytujemy się czatem GPT oraz treściami tworzonymi przez sztuczną inteligencję. Treści tego typu może czasem i nawet dobrze wyglądają, jednak nie są treściami, które roboty indeksujące Google chciałyby zaindeksować. Jeżeli widzisz więc stronę zeskanowaną, ale nie zaindeksowaną, to przeanalizuj ją i zobacz, czy zawiera ona treści i jakiej jakości jest ta treść, przez kogo została napisana – czy przez osobę, która jest aktywna w Internecie, a co za tym idzie Google może ją potraktować jako autorytet w danej dziedzinie, czy też może wrzuciłeś treść napisaną przez jakiś automat albo nawet przez czat GPT? Teraz się zastanawiasz, dlaczego strona nie może zostać zaindeksowana, ale jest jeszcze jeden czynnik równie istotny, który decyduje o tym, dlaczego Google nie indeksuje danej strony.
Zła budowa techniczna strony
Pamiętasz, jak wspominałem o tzw. crawl budgecie, czyli czasie, jaki robot indeksujący może przeznaczyć na to, aby być na Twojej stronie oraz ją zaindeksować? Im strona jest wolniejsza, a wolniejsza jest wtedy, kiedy jest źle zbudowana, tym taki robot musi poświęcić więcej czasu na to, aby się po niej poruszać. Wyobraź sobie, że musisz przebiec szybko 100 m. W pierwszym przypadku jesteś na bieżni, masz buty sportowe, jest dobra pogoda, wieje sprzyjający wiatr. W drugim przypadku jest zima, przed tobą jest 100 m śniegu o głębokości metra. Który odcinek przebiegniesz szybciej pierwszy czy drugi? Oczywiście, że pierwszy. W drugim przypadku kto wie, czy w ogóle dotrzesz do końca owych 100 m i podobnie jest z robotem indeksującym Google. Jeżeli dasz mu kiepskiej jakości technicznie stronę, której nie będzie w stanie przejrzeć, przeanalizować, przeskanować, to nie masz szans, aby taka strona została zaindeksowana. Ponieważ może i robot ją zeskanuje, ale nie będzie już miał wystarczającej ilości zasobów w owym crawl budgecie, aby być w stanie ją zaindeksować. Dlatego też zapamiętaj, jeżeli będziesz chcieć zwiększyć stopień indeksacji strony, musisz upewnić się, że jest ona szybka, że wczytują się szybko treści, że grafiki nie ważą dużo, że strona jest postawiona na szybkim serwerze, że stosujesz system np. wtyczkę LightSpeed w przypadku WordPressa, że PHP na serwerze jest na możliwie najwyższym poziomie itd. Tylko strona dopracowana w 100% technicznie o bardzo wysokie treści i istniejąca już w sieci przez dłuższy czas może zostać w 100% zaindeksowana przez Google.
No dobrze, ale załóżmy, że mamy stronę technicznie doskonałą i wysokiej jakości treści, a w Search Console widzimy, że pojawiają się strony zeskanowane, ale niezaindeksowane. Co zrobić w takiej sytuacji? Po pierwsze upewnij się, że analizujesz strony, które zostały przesłane do site mapy. Jest to bardzo ważne, ponieważ domyślnie w sekcji indeksowanie widzimy strony, które zostały odnalezione przez Google kiedykolwiek, czyli są to wszystkie strony odnalezione przez Google, a nie wszystkie przesłane strony. Jest to bardzo duża różnica, ponieważ niekiedy pewne strony są zapamiętane przez Google, a one już nie istnieją, gdyż zrobiliśmy porządki w obrębie naszego serwisu. Dlatego domyślny widok to jest coś, co powinieneś zmienić zaraz na początku analizowania stopnia indeksacji Twojej strony. Więc wchodząc do Search Console i przechodząc do sekcji indeksowanie, klikasz znajdujący się pod nagłówkiem indeksowanie stron przycisk rozwijający opcje i zmieniasz wszystkie znane strony na wszystkie przesłane strony. Jeżeli nie widzisz opcji, wszystkie przesłane strony, to znaczy, że nie wygrałeś jeszcze site mapy do Search Console, więc koniecznie musisz to zrobić i poczekać chwilę, aż Google przeskanuje site mapy oraz opcja wszystkie przesłane strony będzie widoczna w Search Console. Jeżeli to zrobiłeś i w dalszym ciągu widzisz pewne strony zeskanowane, ale niezaindeksowane, to pozostała Ci do wykonania jeszcze jedna tylko czynność. Wklej po kolei jeden adres po drugim w pole na górze Search Console, sprawdź dowolne url po wklejeniu adresu, a w ciągu kilkunastu sekund dowiesz się, czy strona jest zaindeksowana, czy też nie. Dlaczego o tym mówię? Otóż informacje prezentowane w Search Console nie są aktualizowane na bieżąco. Możesz widzieć, że dana strona jest zeskanowana, ale nie zaindeksowana, ale ona w rzeczywistości będzie już zaindeksowana. Jeżeli tak się stanie, super bierzesz kolejny adres i wklejasz go znowu w pole. Sprawdź dowolny url znowu po kilkunastu sekundach i widzisz, co się dzieje. Jeżeli powiedzmy, drugi adres nie jest zaindeksowany, czyli widzisz informacje: adres url nie znajduje się w Google, to po prawej stronie w sekcji, w której widzisz te informacje, znajduje się link: poproś o zaindeksowanie – klikasz w ten link i po około minucie pojawia się informacja, że adres url został dodany do priorytetowej kolejki do zaindeksowania i tyle i teraz pozostaje Ci już tylko czekać, aż Google zaindeksuje tę stronę. Bierzesz trzeci adres i powtarzasz to, o czym mówiłem przed chwilą na końcu. Jeżeli uporasz już się ze wszystkimi adresami, to kliknij przycisk w sekcji, który nazywa się sprawdź poprawkę – Google w przeciągu około miesiąca czasu przeskanuje wszystkie zgłoszone przez Ciebie strony, aby doprowadzić do tego, by w Search Console była prezentowana aktualna informacja o stanie indeksacji Twojego serwisu. Jeżeli okaże się, że wszystkie strony, które obecnie są widocznie jako zeskanowane, ale niezaindeksowane będą zaindeksowane, no to zamiast na przykład 7 zobaczysz zero, czyli wyczyścisz sobie sekcję ze stron, które na chwilę obecną są zeskanowane, ale nie zaindeksowane.
Należy pamiętać tylko o jednej rzeczy podczas wykonywania tego typu operacji – dziennie możemy dodać tylko maksymalnie 10 adresów url do sprawdzenia w obrębie naszego konta. Dlatego jest to dobra metoda do zrobienia porządków na stronie. Dopiero wówczas, kiedy uporaliśmy się z techniczną jakością naszej strony oraz posiadamy treści naprawdę wysokiej jakości, które zasługują na to, aby zostać zaindeksowane. Jeżeli bowiem tak nie będzie, to może nawet i Google będzie indeksowało nam zgłaszane strony, ale uwierz mi, równie szybko będzie je deindeksować, ponieważ Google nie jest takie głupie i nie daje już się zmuszać do tego, aby zaindeksować coś, co na to nie zasługuje. Dlatego też jeżeli będziesz mieć problem z zaindeksowaniem stron, no to pamiętaj o tym, o czym była mowa przed chwilą. Jeżeli strona jest młoda, zawiera treść o niskiej jakości i posiada złą budowę techniczną, to możesz mieć duży problem z tym, aby zaindeksować takie składowe. Dlatego musisz zrobić krok w tył i zadbać o dobrą treść oraz o dobrą budowę techniczną strony. No bo na jeden z czynników, czyli wiek stron nie masz wpływu. Po prostu strona musi istnieć wystarczająco długo, aby Google było w skłonne indeksować ją szybko.
I w pełny sposób, oczywiście pod warunkiem, że posiadasz dobrej jakości treść oraz strona jest poprawnie zbudowana technicznie na koniec jeszcze o jednej kwestii. Otóż strona może być stara, może posiadać wysokiej jakości. Treść może być też bardzo dobrze zbudowana technicznie, ale nie będziesz w stanie zaindeksować jej pewnych elementów składowych. Sytuacja taka będzie miała miejsce wówczas, kiedy treści owe są już zdezaktualizowane. Z taką sytuacją mamy do czynienia np. na moim blogu, gdzie niektóre artykuły, które kilka, kilkanaście lat temu cieszyły się dużą po czytelnością, nie są już aktualne i Google nie jest w stanie ich zaindeksować. Nawet jak wchodzę i próbuje wymusić taką indeksację, to jednak po pewnym czasie strona wypada z indeksu. To tylko pokazuje, że wbrew obiegowym opiniom Google naprawdę dobrze sobie radzi z indeksowaniem treści i jeżeli masz problem, aby Twoja treść znalazła się w indeksie, to musisz wrócić do podstaw, do korzeni, upewnić się, że masz dobrej jakości treść, a witryna jest odpowiednio szybka i dobrze zbudowana technicznie powodzenia.