Stop alle Google Analytics spam met sléchts 2 filters

Update: 18 januari 2017

Sinds de plaatsing van deze blog zien we een aantal nieuwe spammers in Google Analytics. We hebben de blog daarom geüpdatet om ook de nieuwste spammers uit te sluiten. Door de toename aan spammers komen we helaas niet meer weg met twee filters. In deze blog vind je de twee originele filters plus twee nieuwe filters. Wanneer je deze correct instelt, zullen alle bestaande vormen van Google Analytics spam worden uitgesloten.


Google Analytics is de meest gebruikte dienst voor webanalyse op het internet. Het biedt een enorme hoeveelheid aan mogelijkheden voor de analyse van bezoekers en hun gedrag op onze sites. Helaas worden de rapporten van GA de afgelopen tijd steeds vaker vervuild met spam.

Om het meeste uit GA te halen is het belangrijk deze ongewenste bezoekers zo snel mogelijk te stoppen. In deze blog leg ik je uit hoe je nieuwe spam kunt voorkomen. Op deze manier hoef je niet meer voor iedere nieuwe spammer een aparte filter aan te maken.

Steeds vaker vind je allerlei spam tussen je verwijzingen in Google Analytics.

Google Analytics spam tussen het verwijzingsverkeer

Een aantal tekenen die wijzen op Google Analytics spam:

  • Het duidelijkst is de aanwezigheid van verdachte verwijzingen in je rapporten (bv. semalt.com / referral).
  • Drastische veranderingen in metrics, zoals een gestegen bouncepercentage of een lagere gemiddelde sessieduur.
  • Vaak herken je spam ook aan de waarde (not set) in dimensies als land, plaats, en vooral hostnaam.

Wat is referrer spam?

De spam in Google Analytics wordt vaak referrer spam genoemd, omdat deze oorspronkelijk alleen als verwijzingen in je rapporten opdoken. Op dit moment komt de spam niet alleen meer binnen als verwijzingen, maar ook in de vorm van zoekwoorden, pagina’s, gebeurtenissen, en zelfs directe bezoeken.

Laten we eerst even kijken wat een legitieme verwijzing inhoudt. Een verwijzing is een naam die wordt meegegeven wanneer een browser van de ene naar de andere pagina gaat. In de meeste gevallen wordt een verwijzing gebruikt om aan te geven waar de gebruiker vandaan komt (bv. iq-leads.nl / referral).

Deze verwijzing kan een willekeurige naam worden gegeven. Spammers gebruiken vaak een pagina die zij willen promoten, zoals EVENT-TRACKING.COM. Vervolgens doen ze via een geautomatiseerd script herhaaldelijk aanvragen, waardoor ze in de rapporten van je Analytics terecht komen. Dit is referrer spam.

Waarom bevuilen ze mijn rapporten?

Welk voordeel hebben spammers hieraan? Het belangrijkste motief is bezoek. Mensen zijn nieuwsgierig en bezoeken de verwijzende URL om uit te vinden wie er naar hun site linkt. De spammers pakken duizenden GA accounts tegelijkertijd, dus je kunt wel begrijpen hoeveel verkeer het spammen oplevert.

Hoe doen ze het?

Google Analytics spam komt in twee vormen: ghost spam (bv. floating-share-buttons.com) en crawler spam (bv. success-seo.com).

Er bestaan twee verschillende soorten spam in Google Analytics: ghost spam en crawler spam.

Ghost spam

Het grootste deel van de spam in GA is ghost spam. Deze naam is gekozen omdat ghost spam op geen enkel moment je website bezoekt. En toch verschijnen ze als verwijzingen in je rapporten. Hoe doen ze dit? Ze richten zich niet op je website maar direct op je GA account zelf.

Om dit te realiseren maken ze gebruik van Google’s Measurement Protocol. Dit is een tool waarmee je direct data naar de servers van GA kunt sturen. De spammers maken hier misbruik van door hun data naar willekeurige GA accounts te versturen. Of je nu gebruik maakt van WordPress, Magento, of een ander CMS, de enige manier om ghost spam te stoppen is met een filter in GA.

Crawler spam

Crawler spam maakt gebruik van bots die net als de bot van Google verschillende websites bezoeken. Google doet dit om websites te indexeren en vindbaar te maken in hun zoekresultaten. Spammers doen het om hun gegevens achter te laten in je GA account. De crawler negeert je robots.txt en is enkel te stoppen met de juiste filters.

Zo voorkom je nieuwe Google Analytics spam

Met een combinatie van twee filters stop je alle Google Analytics spam in je rapporten:

  • Een geldige hostnaam filter die alle vormen van ghost spam tegenhoudt.
  • Een campagnebron filter die alle bekende crawler spam stopt.

Geldige hostnaam filter (ghost spam)

Een hostnaam is in de meeste gevallen de URL van je website (bv. iq-leads.nl). Omdat spammers niet weten welke websites ze aanvallen, hebben ze de waarde (not set) of een vreemde hostnaam. Door een filter te maken die enkel bezoek accepteert naar de hostnaam van jouw website, voorkom je ghost spam in jouw rapporten.

1. Ga in Analytics naar “Beheerder” en selecteer de weergave waar je de filter voor wilt instellen.

2. Selecteer “Filters”.

3. Selecteer “+Nieuw filter”.

4. Selecteer “Nieuw filter maken” en vul “Geldige Hostnaam Filter” in als filternaam.

5. Als filtertype kies je “Aangepast”.

6. Selecteer “Opnemen” en in het filterveld “Hostnaam”.

7. Vul in het filterpatroon jouw URL (bv. iq-leads.com of sharpspring.nl) en googleusercontent *.

8. Druk op “Opslaan” en je filter is klaar.

* googleusercontent is de hostnaam die Google gebruikt wanneer bezoekers met Google Translate je pagina’s vertalen. Voor onze website luidt het filterpatroon: iq-leads.com|googleusercontent. Omdat we gebruik maken van een reguliere expressie plaatsen we een “” voor iedere “.” in de URL.

Google Analytics Spam - hostnaam filter tegen ghost spam.

Geldige hostnaam filter

Campagnebron filter (crawler spam)

In deze filter gaan we alle crawlers blokkeren met één filter. We gebruiken in deze filter een expressie die alle actieve crawler spam uitsluit. Dit is de expressie die wij op dit moment voor onze eigen sites gebruiken:

(best|dollar|success|top1)\-seo|(videos|buttons)\-for|anticrawler|^scripted\.|semalt|forum69|7makemon|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|uptime(bot|check|\.com)

1. Ga in Analytics naar “Beheerder” en selecteer de weergave waar je de filter voor wilt instellen.

2. Selecteer “Filters”.

3. Selecteer “+Nieuw filter”.

4. Selecteer “Nieuw filter maken” en vul “Crawler Spam Filter” in als filternaam.

5. Als filtertype kies je “Aangepast”.

6. Selecteer “Uitsluiten” en in het filterveld “Campagnebron”.

7. Plaats in het filterpatroon een expressie met alle bekende crawlers.

8. Druk op “Opslaan” en je filter is klaar.

Google Analytics Spam - campagnebron filter tegen crawler spam.

Campagnebron filter

Een expressie in een filter heeft een limiet van 255 karakters. Creëer dus een kopie van deze filter met een nieuwe expressie wanneer er geen ruimte meer is.

Update: 18 januari 2017

Sinds de plaatsing van deze blog zijn er aardig wat nieuwe spammers bij gekomen. Hierdoor moeten we een tweetal extra filters aanmaken. Naast bovenstaande filters voor het uitsluiten van ghost spam en crawler spam moeten we een extra crawler spam filter toevoegen en een filter voor zogenaamde language spam.

Voor de crawler spam volg je precies dezelfde stappen als bij de eerste filter voor crawler spam. Gebruik de volgende expressie:

datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter|top10\-way

Sinds kort ervaren we ook een nieuwe vorm van spam die wordt herkent door de taal waar de hit van afkomstig is. Normaal gesproken is die iets als nl-nl voor Nederlands en en-gb voor Engels.

Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!

Bovenstaande “taal” is duidelijk spam. Met de volgende filter zorg je ervoor dat ook al deze language spam wordt uitgesloten.

1. Ga in Analytics naar “Beheerder” en selecteer de weergave waar je de filter voor wilt instellen.

2. Selecteer “Filters”.

3. Selecteer “+Nieuw filter”.

4. Selecteer “Nieuw filter maken” en vul “Crawler Spam Filter” in als filternaam.

5. Als filtertype kies je “Aangepast”.

6. Selecteer “Uitsluiten” en in het filterveld “Taalinstellingen”.

7. Plaats in het filterpatroon een expressie met alle bekende crawlers.

\s[^\s]*\s|.{15,}|\.|,

8. Druk op “Opslaan” en je filter is klaar.

En nu?

Als het goed is komt er geen nieuwe spam meer binnen. Ghost spam wordt in ieder geval geblokkeerd. Wanneer er nieuwe crawlers komen, zul je deze moeten toevoegen aan de expressie in je crawler spam filter. In veel gevallen zullen je maandelijkse bezoeken dalen, maar daar krijg je de werkelijke cijfers voor terug.

Om bestaande Google Analytics spam uit je rapporten te filteren, moet je gebruik maken van segmenten. Ook deze vind je in de “Beheerder”-sectie van je GA account. Een segment toont je een deel van de data aan de hand van de door jou opgestelde condities. Je kunt de expressie uit je crawler spam filter gebruiken om historische spam met een segment te filteren.

Ik hoop dat deze blog je heeft geholpen en dat je Google Analytics account mooi is opgeschoond. Spam is een probleem voor iedereen, dus als deze blog jou heeft geholpen, overweeg hem dan te delen, zodat ook anderen er iets tegen kunnen doen. Zie je nieuwe referral spam die nog niet door onze filters worden gepakt? Laat een reactie achter en vertel jouw ervaringen, zodat we deze blog kunnen updaten!

Download ons Whitepaper: Google Analytics voor beginners