Co to je referrer spam a jak s ním zatočit?

Digichef

Poslední dobou se nám v Google Analytics mohou objevovat prapodivné zahraniční stránky, které na nás odkazují. Prvotní radost z návštěvnosti našeho webu ze zahraničí vystřídá skepse. Odkazující stránky nejsou absolutně relevantní a aby toho nebylo málo, zkreslují nám statistiky typu návštěvnost, míra opuštění a doba trvání návštěvy, grrrrr!

image

Ukázka referrer spamu

Co je to tedy ten referrer spam?

Název refferer spam vznikl z názvosloví referral, které označuje odkazující stránku, za kterou se tento spam vydává. Někdy se také může jednat o přímou (direct) či organickou (organic) návštěvnost. Jedná se o vytvořené skripty, které využívá technicky orientované hnutí, tzv. spammeři.

Možná si teď pokládáte otázku, proč to spammeři dělají a co z toho mají? Inu, odpověď je celkem jednoduchá – návštěvnost. Lidé jsou totiž tvorové od přírody zvídaví a neváhají se podívat, odkud se chodí „lidi“ dívat na jejich stránky. Tím to ale samozřejmě nekončí, spammeři vynaloží nemalé úsilí k tomu, aby zasáhli miliony účtů po celém světě, a to není zadarmo. Business modelem je nasazený affiliate na tyto odkazující stránky a z milionu zásahů někdo prostě nakoupí nabízené produkty či služby. V termínech SEO bychom se bavili o zakázané black hat technice.

Jak funguje refferer spam?

Spammeři používají 2 techniky – Ghost spam a Crawler Refferer spam. Ghost spam má v českém překladu název Duch, protože technicky nikdy nenavštíví naše stránky. Funguje na principu automatického skriptu, kdy jsou posílána falešná data do cílených účtů Google Analytics. Lze ho blokovat pouze pomocí filtrů v Google Analytics.

Crawler Referrer spam naopak navštíví naše stránky a díky tomu ho lze blokovat jak pomocí filtrů, tak i pomocí .htaccess file.

image

Ghost spam

Jak se proti tomu bránit?

V červnu to bylo docela žhavé téma v Google, neboť se s tím čeští klienti začínají potýkat. Řešení není nikterak technicky náročné, vyřešíme to pomocí filtrů v Google Analytics, jak bylo výše avizováno. Pojďme tedy do správce > filtry a přidejme si nový vlastní filtr. Pole Typ filtru budeme filtrovat podle Zdroje kampaně.

image

Vlastní filtr

Databázi referral spammerů najdete zde v uvedeném odkazu. Dále je také k dispozici na webu v textové podobě, ale v tomto případě bychom museli jednotlivé weby oddělovat oddělovačem „|“ a před každou tečkou použít obrácené lomítko „\“, neboť tečka patří mezi regulární výrazy.

Jakmile máme hotovo, jízda pokračuje... Teď se nám naopak hodí textový seznam referrer spamů z piwiku. Přidáme ho do vyloučených odkazujících stránek ve Správci > Údaje o měření > Seznam vyloučených odkazujících stránek.

image

Vyloučené odkazující stránky

3, 2, 1, hotovo. Nu, říká se do třetice všeho dobrého, tak si pěkně v Google Analytics v Nastavení zobrazení aktivujeme Filtrování robotů.

image

Filtrování robotů

Jakmile máme nastaveno, tak jsme vytvořili účinnou obranu proti zkreslování statistik v našich účtech. Nezapomeňme, že jakmile se objeví další spamy, tak je potřeba doplnit nové filtry. Toto by mohlo být vyřešené skriptem, který již v současné době existuje. Nevýhodou však je, že mu musíte dát plný přístup k vašemu účtu, což je mi docela proti srsti.

Závěrem chci poděkovat panu Tichému z Google, že danou problematiku rozebral do detailů a také děkuji svému klientovi, který mě donutil se tématem zabývat více. Stal se již cílem spamu ze zahraničí, takže pevně věřím, že tento článek může pomoci i vám.

SPAM, SPAM, SPAM!

  • Celkový průměr hodnocení: 4.33 z 5
  • 4.33
  • 4.33
  • 4.33
  • 4.33
  • 4.33

21. června 2015

K článku již nelze přidávat další komentáře.

  1. Patrik Fingr | 21. června 2015

    Super článek, pouze zde chybí informace na závěr. Pokud se někomu jakožto provozovatel online projektu znelíbíte konkurenci nebo někomu, kdo s referraly umí pracovat, filtry nejsou univerzálním řešením pro všechny případy (někdy to odfiltrovávat nelze, udělá-li se to cíleně).

  2. Petr Kučera | 22. června 2015

    Patriku, děkuji za komentář. Někdy se stává, že jsou Analytics záměrně duplicitně nasazovány na jiné weby, aby to zkreslovalo statistiky nebo jen navyšovalo návštěvnost. To se dá zjistit v cílovém publiku => technologie => síť => název hostitele. Filtr na úrovni vlastní domény projektu by to ještě zachránil, ale jak říkáte, vše odfiltrovat nepůjde, pokud se jedná o sofistikované útoky.

  3. Petr Jirsa | 7. října 2015

    Dobrý den, mám ještě dotaz k jinak skvělému článku. Seznam vyloučených odkazujících stránek musím vytvořit tak, že budu z textového souboru vkládat jednu adresu po druhé? V době psaní dotazu cca 285 url. A je v pořádku, že mám automaticky v seznamu vyloučených odkazujících stránek také vlastní doménu?
    Dějuji za odpověď

  4. Petr Kučera | 29. října 2015

    Dobrý den, Petře,

    využijte prosím tuto stránku: http://tools.lynt.cz/spammers.php. Filtry můžete vkládat pěkně pohromadě do Analytics. Jak se v článku píše, GA omezuje filtry na 255 znaků, takže v tuto chvíli bude potřeba vytvořit 23 filtrů a čas od času přidat další, které nově vzniknou.

    Vlastní doména je v pořádku v seznamu vyloučených odkazujících stránek.

    Ať se daří!
    Petr Kučera