Verwijzingsspam oplossen in Google Analytics

 Verwijzingsspam oplossen in Google Analytics

Patrick Harvey

Ontvangt u veel verwijzingsspam in Google Analytics? Bent u bang dat uw rapporten hierdoor worden beïnvloed, maar weet u het niet zeker?

In dit bericht behandelen we een paar verschillende methoden die u kunt gebruiken om verwijzingsspam in uw rapporten te blokkeren. We zullen ons vooral richten op het bereiken van dit doel met één filter.

Laten we eerst eens bespreken wat verwijzingsspam is en waarom u het wilt vermijden.

Wat is verwijzingsspam?

Verwijzend verkeer, ook bekend als een "hit", is verkeer dat niet afkomstig is van zoekmachines (organisch verkeer) of gebruikers die uw website bezoeken door het domein ervan in te voeren in hun adresbalk (direct verkeer).

Voorbeelden van verwijzingsverkeer zijn die van sociale mediasites of een andere site die naar de uwe linkt.

Hits worden geregistreerd wanneer gebruikers interactie hebben met uw website, maar ze zijn voornamelijk afkomstig van bezoeken. In Google Analytics worden hits geregistreerd als pageviews, gebeurtenissen, transacties en meer. Referral spam genereert valse hits die meestal afkomstig zijn van bots of valse websites.

Zie ook: 16 bewezen YouTube-video-ideeën om je kanaal een boost te geven

Elke website met een Google Analytics-account heeft zijn eigen trackingcode die hem identificeert. Daarom moet u het Google Analytics-script aan de bestanden van uw site toevoegen om de dienst verkeersgegevens en gebruikersgedrag voor uw site te laten registreren. Deze code wordt meestal in de header geplaatst, hoewel het veel gemakkelijker is om hem via een plugin toe te voegen.

Wanneer een legitieme gebruiker uw website bezoekt, gaan de gegevens via uw server voordat ze naar Google Analytics worden gestuurd.

Bij een veel voorkomende vorm van verwijzingsspam, bekend als "ghost spam", aanvallers gebruiken geautomatiseerde scripts om nepverkeer naar willekeurige Google Analytics-trackingcodes te sturen Wanneer deze valse hits naar uw code worden gestuurd, worden de gegevens als resultaat opgenomen in uw analytics, ondanks het feit dat het verkeer uw site nooit heeft bereikt.

Soms komen valse verwijzingen van kwaadaardige crawlers. Verkeer dat via dit soort verwijzingsspam wordt verzonden doet door uw server gaan, maar daarbij de regels in het robots.txt-bestand van uw site negeren. Het verkeer wordt dan doorgestuurd naar Google Analytics en geregistreerd als een hit.

Hoe u verwijzingsspam kunt herkennen in Google Analytics

U kunt verwijzingsspam vinden naast de andere verwijzingen die Google Analytics voor uw site registreert. U vindt deze door te gaan naar Acquisitie → Alle verkeer → Verwijzingen.

Sommige spamwebsites zijn gemakkelijk te herkennen. Ze hebben meestal vreemde domeinen met onprofessionele namen, zinnen als "geld verdienen" of verwijzingen naar inhoud voor volwassenen.

Ze kunnen ook veel koppeltekens hebben of niet-standaard domeinextensies gebruiken. Andere spamverwijzingen zijn niet zo gemakkelijk te herkennen, dus u zult alternatieve methoden moeten gebruiken.

Zorg er trouwens voor dat u een aangepast bereik gebruikt wanneer u uw verwijzingen in Google Analytics bekijkt. Stel het in om op zijn minst de laatste twee maanden te bekijken, maar u kunt zo ver teruggaan als u wilt. Houd er wel rekening mee dat hoe verder u teruggaat, hoe meer gegevens u zult moeten doorzeven.

Omdat hits in de vorm van ghost spam niet afkomstig zijn van de eigenlijke server van uw site, hebben ze meestal bouncepercentages van 100% en sessies die 0 minuten en 0 seconden duren. Klik op de kolom Bouncepercentage om de gegevens eerst te sorteren op hoogste bouncepercentages om het uzelf gemakkelijker te maken.

Crawler-spam is veel moeilijker op te sporen omdat deze bots doe uw site bezoeken, dus ze gebruiken meestal geldige URL's en hebben nauwkeurige bounce- en sessiegegevens. Als u denkt dat een bron-URL in uw verwijzingsrapporten spam is, bezoek de site dan niet om het te bevestigen.

Zoek in plaats daarvan op Google door het tussen aanhalingstekens te zetten ("google.com" bijvoorbeeld) om te zien of het als spam is gemeld.

Als u deze sites toch bezoekt, zorg er dan voor dat u de nieuwste versies van browsers zoals Chrome en Firefox gebruikt, die beide beveiligingen hebben om u tegen kwaadaardige sites te beschermen. Zorg er ook voor dat op uw computer of apparaat antivirussoftware is geïnstalleerd en actief is.

Waarom is verwijzingsspam slecht?

Het rapport Verwijzingen is niet de enige plaats waar gegevens van verwijzingsspam binnensijpelen in Google Analytics. U vindt ze overal in uw rapporten, met name in de hoofdweergave waar het totale aantal hits van uw site of individuele pagina's staat.

Als uw rapporten worden bezoedeld door hits die geen echte mensen vertegenwoordigen, kunt u verkeerde marketingbeslissingen nemen die leiden tot campagnes die niet aanslaan of geen inkomsten opleveren.

Hoewel Google veel heeft gedaan om te voorkomen dat verwijzingsspam uw gegevens aantast, is het een veel voorkomend verschijnsel dat de meeste sites op het web treft.

Hoewel u altijd een kwaliteitshost moet kiezen, een beveiligingsplugin moet gebruiken als u geen beheerde WordPress-host gebruikt, en alleen thema's en plugins moet installeren van betrouwbare bronnen, kunt u niet veel doen om spam tegen te gaan, omdat ze ofwel uw site niet rechtstreeks aanvallen ofwel manieren hebben om het verkeer legitiem te laten lijken.

Daarom laten we je zien hoe je verwijzingsspam kunt oplossen door het te filteren in Google Analytics.

Hoe u verwijzingsspam in Google Analytics kunt oplossen

Filters in Google Analytics zijn permanent, en gefilterde gegevens kunnen niet worden teruggehaald. Daarom moet u altijd een ongefilterde weergave voor uw site maken, omdat u dan gegevens kunt zien die mogelijk ten onrechte zijn weggefilterd. Het helpt u de hoeveelheid spam te controleren die uw site ontvangt, zelfs nadat u filters hebt toegepast om deze te verwijderen.

Het creëren van een ongefilterde weergave voor de Analytics-account van uw site is eenvoudig. Begin vanuit het Admin-scherm (de Admin-knop bevindt zich links onderaan), en klik op Weergave-instellingen onder het Weergavepaneel (rechterpaneel).

Begin met het hernoemen van uw huidige weergave, die standaard "Alle websitegegevens" heet, naar "Hoofdweergave" door de naam te veranderen in het veld Weergavenaam. Klik op Opslaan.

Als u terug naar boven scrolt, ziet u rechtsboven in het scherm een knop "Weergave kopiëren". Klik erop, noem de nieuwe weergave "Ongefilterde weergave" en klik op Weergave kopiëren om deze te bevestigen.

U kunt ook teruggaan naar de hoofdweergave en dit proces herhalen om een andere weergave te maken met de naam "Testweergave". U kunt deze weergave gebruiken om nieuwe filters te testen voordat u ze toepast op de hoofdweergave.

U hebt nu een ongefilterde, en eventueel testweergave in Google Analytics. Als u filters hebt toegepast op uw hoofdweergave, verwijdert u deze uit de ongefilterde en testweergaven. Als u dat niet hebt gedaan, ontvangt u een melding over overbodige weergaven van Google Analytics, die u gerust kunt negeren.

Spookreferentiespam oplossen met één filter

U hebt al spam-URL's geïdentificeerd in uw verwijzingsrapporten. Veel webmasters gaan meteen aan de slag en maken filters om te voorkomen dat deze URL's in hun rapporten verschijnen.

Helaas gebruiken spammers zelden één enkele bronnaam in hun aanvallen, wat betekent dat u voortdurend nieuwe filters moet aanmaken om alle volgende spam die in uw rapporten verschijnt te blokkeren.

Wat u in plaats daarvan moet doen, is een filter maken dat alleen gegevens van echte hostnamen bevat.

Achter elk domein staan de computer en het netwerk waaraan het is gekoppeld, die kunnen worden geïdentificeerd met een IP-adres. Deze IP-adressen krijgen unieke "hostnamen" om ze te identificeren met gemakkelijk te onthouden alfanumerieke namen.

Het voorvoegsel "www" is een hostnaam, zoals elk domein op het web, omdat ze beide verbonden zijn met computers of netwerken met IP-adressen.

Ghost spam wordt naar willekeurige Google Analytics tracking codes gestuurd in plaats van naar de hostnamen die aan uw site gekoppeld zijn. Dit betekent dat het veel effectiever is om verwijzingen die valse hostnamen gebruiken eruit te filteren.

De filter die we gaan maken, verwijdert ook valse hits door valse hostnamen in uw rapporten over trefwoorden, pageviews en direct verkeer.

Een reguliere uitdrukking maken voor uw filter

We gaan een filter maken dat alleen hits bevat van geldige hostnamen om valse hostnamen uit te sluiten. Dit betekent dat u een lijst moet maken van geldige hostnamen die aan uw site zijn gekoppeld.

Als u filters hebt toegepast op uw masterweergave, schakel dan over naar de ongefilterde weergave die u eerder hebt gemaakt. U vindt hostnamen die door Google Analytics worden geïdentificeerd door naar Audience → Technology → Network te gaan en de primaire dimensie te wijzigen in Hostname.

Hier is een lijst van de typen hostnamen die u in uw rapporten wilt opnemen:

  • Domein - Dit is de primaire hostnaam die wordt gebruikt om uw site op het web te identificeren en de naam waar legitieme verwijzingen doorheen komen, dus die moet worden opgenomen. U kunt de subdomeinen die u hebt gemaakt negeren, omdat ze onder uw hoofddomein vallen.
  • Gereedschap & diensten - Dit zijn tools die u op uw website gebruikt en mogelijk aan uw analytics-account hebt gekoppeld om gegevens voor campagnes te verzamelen. Hieronder vallen tools zoals uw e-mailmarketingdienstverlener, betalingsgateways, vertaaldiensten en boekingssystemen, maar ook externe tools, zoals YouTube, die u in uw account hebt geïntegreerd, tellen mee.

Maak een lijst van alle geldige hostnamen voor uw site op basis van deze tips en zorg ervoor dat elke naam overeenkomt met de naam in het veld Hostname. Sluit de volgende hostnamen uit:

  • Hostnamen die niet zijn ingesteld
  • Ontwikkelingsomgevingen, zoals localhost of het subdomein van uw staging-omgeving
  • Archief- en schrapsites
  • Hostnamen die er legitiem uitzien maar die ofwel sites zijn die u niet bezit ofwel tools en diensten die niet geïntegreerd zijn met uw Google Analytics-account. Dit zijn waarschijnlijk spam die vermomd zijn als legitieme bronnen.

U zou nu een lijst moeten hebben met geldige hostnamen van bronnen die u beheert of gebruikt met uw Analytics-account. U moet nu een reguliere expressie, of "regex", maken die al deze combineert.

Een reguliere expressie is een speciale tekststring om een zoekpatroon te beschrijven. Dat zoekpatroon is in dit geval een lijst van geldige hostnamen. Google Analytics zal deze expressie gebruiken om de hostnamen te identificeren die u in uw gegevens wilt opnemen nadat u uw filter hebt gemaakt.

Hier is een voorbeeld van hoe je uitdrukking eruit moet zien:

 yourdomain.com 

De pijp karakters zijn hier belangrijk. Ze betekenen OR en helpen Google Analytics om elke hostnaam van elkaar te onderscheiden. U mag nooit pijp-tekens aan het begin of einde van een expressie invoegen, dus begin of eindig uw reguliere expressie niet met .

Het filter aanmaken

Navigeer naar het Admin-scherm, en schakel over naar Test View als u er een hebt gemaakt. Schakel over naar Master View als dat niet het geval is.

Klik op de link Filters onder de rechterkolom Weergave en vervolgens op de rode knop Filter toevoegen. Hier volgt een snel overzicht van hoe u dit filter kunt configureren:

  • Methode: Nieuw filter aanmaken
  • Naam: Iets beschrijvends, zoals "Geldige Hostnamen".
  • Filtertype: Aangepaste
    • Zorg ervoor dat Inclusief is geselecteerd
  • Filterveld : Hostname
  • Filterpatroon: Kopieer en plak uw uitdrukking hier, zonder spaties.

Zodra u uw uitdrukking in het veld Filterpatroon hebt geplakt, klikt u op de link Dit filter controleren om te zien of ongewenste hostnamen correct worden uitgefilterd. Klik op Opslaan om het filter te maken zodra u klaar bent.

Als alles goed is, herhaal je het proces met je master view, en verwijder je de testversie.

Filter spam van crawler bots

Sommige spammers gebruiken crawler bots om valse hits naar uw site te sturen. Bovendien werken sommige tools van derden die u gebruikt, waaronder tools voor projectbeheer en sitebewaking, via crawler bots als u ze in uw site hebt geïntegreerd.

U kunt dit type spam blokkeren door een soortgelijke expressie te maken, maar dan met bronnamen in plaats van hostnamen. Navigeer opnieuw naar Audience → Technology → Network en voeg Source toe als secundaire dimensie.

Hier zijn twee verschillende voorgebouwde expressies die je kunt gebruiken van de site van Carlos Escalera Alonso, als je het jezelf gemakkelijker wilt maken.

Uitdrukking 1:

 semalt 

Expressie 2:

 (kunstblog 

U moet uw bron-URL's doornemen om te bepalen welke tools crawlers naar uw site sturen en daar uw eigen uitdrukking voor maken.

Zie ook: 12 slimme tips voor nieuwe bloggers (wat ik wou dat ik 10 jaar geleden wist)

Wanneer u deze filters toevoegt aan uw test- en hoofdweergaven, gebruikt u Uitsluiten als filtertype en Campagnebron als filterveld.

Laatste gedachten

Verwijzingsspam kan een ravage aanrichten in de statistieken van uw site. Het kan lijken alsof u meer hits en een hoger bouncepercentage hebt dan u in werkelijkheid hebt. Daarom is het belangrijk verwijzingsspam in uw rapporten te blokkeren.

Zorg ervoor dat u drie verschillende weergaven hebt voor uw site: een hoofdweergave, een voor ongefilterde gegevens en een voor testen. Controleer het filtergebied voor uw ongefilterde weergave om er zeker van te zijn dat er geen zijn, want het is belangrijk dat u controleert wat er wordt geblokkeerd.

Hoewel dit artikel ging over verwijzingsspam, is het belangrijk op te merken dat er nog andere manieren zijn waarop u spam kunt filteren in Google Analytics. U kunt de bovenstaande gids bijvoorbeeld gebruiken om spam te vinden en te filteren voor de volgende rapporten:

  • Taal
    • Filtertype: Taalinstellingen
  • Verwijzing
    • Filtertype: Campagne Bron*
  • Organisch trefwoord
    • Filtertype: Zoekterm
  • Dienstverlener
    • Filtertype: ISP Organisatie
  • Netwerk Domein
    • Filtertype: ISP-domein

Let op: Als je referral spam gaat filteren op bron, overweeg dan om items toe te voegen uit Matomo's referrer blacklist (spammers.txt).

Verwante lectuur:

  • 5 Krachtige Analytics en Statistieken Plugins voor WordPress
  • De beste website-analysetools vergeleken

Patrick Harvey

Patrick Harvey is een doorgewinterde schrijver en digitale marketeer met meer dan 10 jaar ervaring in de branche. Hij heeft een enorme kennis van verschillende onderwerpen, zoals bloggen, sociale media, e-commerce en WordPress. Zijn passie voor schrijven en het helpen van mensen om online succesvol te zijn, heeft hem ertoe aangezet om inzichtelijke en boeiende posts te maken die waarde toevoegen aan zijn publiek. Als ervaren WordPress-gebruiker is Patrick bekend met de ins en outs van het bouwen van succesvolle websites, en hij gebruikt deze kennis om zowel bedrijven als particulieren te helpen hun online aanwezigheid te vestigen. Met een scherp oog voor detail en een niet aflatende toewijding aan uitmuntendheid, is Patrick toegewijd om zijn lezers te voorzien van de nieuwste trends en advies in de digitale marketingindustrie. Als hij niet aan het bloggen is, is Patrick te vinden op het verkennen van nieuwe plaatsen, het lezen van boeken of het spelen van basketbal.