Bardzo ciekawe pytanie postawione Mattowi dotyczyło tego, co spędza sen z powiek wielu webmasterów, „drżących” o to, że ktoś ukradnie im treść ze strony, umieści na swojej witrynie/zapleczu – a następnie Google to nie ich stronę uzna za oryginał, tylko „spamera/złodzieja” – i wyindeksuje właściwą, oryginalną treść.
Analizowany przypadek: „Załóżmy, że mamy stronę A oraz stronę B. Strona A jest odwiedzana przez boty co godzinę, strona B – tylko jeden raz na dobę. Na stronie B pojawia się artykuł, strona A kopiuje go, zmieniając przy okazji datę publikacji. Następnie strona A zostaje odwiedzona przez Googlebota. Która treść będzie oryginałem dla Google – a w konsekwencji będzie zajmować wyższe pozycje w SERPach?”
Jak wiemy, na częstotliwość pojawiania się robota na stronie mają wpływ różne czynniki, jak wiarygodność witryny, obliczana „swoimi sposobami” przez Google, a której jednym z wyznaczników jest np. PageRank witryny – strony z wyższym PR, a dodatkowo jeszcze często umieszczające nowe teksty, są odwiedzane przez roboty częściej – i automatycznie treści na nich publikowane szybciej „wpadają do indeksu”.
Niestety, Matt przyznaje, że teoretycznie Google może „nie poradzić sobie” z właściwym określeniem „praw autorskich” i przypisać wspomniany artykuł stronie A, a nie stronie B. Nie zdarza się to często, ale … zdarza.
Co można zrobić, aby się zabezpieczyć przed tym?
1) Można wykorzystać medium społecznościowe i umieścić tweeta. Ludzie trafią na taką stronę, przeczytają, jak się spodoba – umieszczą do niej link – po którym Googlebot trafi szybciej do oryginału, niż do „złodzieja”.
2) Można też użyć pingowania – aby ściągnąć robota szybciej na stronę.
Jeżeli to nie pomoże (albo po prostu nie zrobiliśmy tego – nie używamy Twittera, Blipa’a czy Facebook’a) i niestety strona A skopiowała treść, zmieniając jego datę powstania – wówczas mamy dwa rozwiązania na „dochodzenie swoich praw”:
1) Można zgłosić fakt kradzieży treści korzystając z tzw. Digital Millennium Copyright Act (DMCA) reguest. Za pośrednictwem tego adresu informujemy Google, że to my jesteśmy autorem danej treści.
Należy pamiętać, aby mieć tutaj pewność co do słuszności swojego działania – na stronie Google podawany jest przykład złego „oszacowania pewności”, co kosztowało firmę, która zgłosiła rzekome naruszenie, 100.000 USD. Google zaleca, w przypadku wątpliwości, kontakt z se swoim prawnikiem w tym zakresie.
2) Można użyć właściwego spam raportu – zwłaszcza, jeżeli strona B kradnie nam tekst automatycznie (np. poprzez kanał RSS, poprzez który publikujemy całe wpisy na blogu). Użyjemy w takim przypadku tego adresu .
Google cały czas pracuje nad ulepszaniem „wychwytywania” oryginalnego kontentu, m.in. analizując sposoby wskazania robotom oryginalnego źródła pochodzenia tekstu. Np. w Google News eksperymentuje z nowymi tagami, które mają wskazać właściwego autora tekstu.
Co ma zrobić zwykły użytkownik? Hm… Liczyć na Google, ale przede wszystkim – dbać samemu o swoje interesy – jak w każdym biznesie 🙂
Jedno Pytanie. A skąd mam wiedzieć gdzie był robot po raz pierwszy u mnie czy u złodzieja? U mnie to jeszcze jakoś sprawdzę kiedy był ale u złodzieja, widzę tylko w kopii ostatnia wizytę robota ( ale tej pierwszej nie).
Dlatego pinguje zaraz po opublikowaniu, wrzucam newsy do rss, twitter i facebook. Po kilku dniach publikuje artykuły na innych stronach z anchor linkami do mojej witryny….
Czy cos więcej mozna zrobić?
Dobrze Pan robi. To jest dokładnie to, co zaleca Matt – nie pisał tylko o podlinkowywaniu – ale to logiczne 🙂