Comment résoudre le problème du spam de renvoi dans Google Analytics ?

 Comment résoudre le problème du spam de renvoi dans Google Analytics ?

Patrick Harvey

Vous recevez beaucoup de spams dans Google Analytics et vous craignez que vos rapports soient entachés de spams, mais vous n'en êtes pas certain ?

Dans cet article, nous allons présenter différentes méthodes pour bloquer les spams de référence dans vos rapports. Nous allons principalement nous concentrer sur l'utilisation d'un seul filtre.

Tout d'abord, expliquons ce qu'est le spam de renvoi et pourquoi il faut l'éviter.

Qu'est-ce que le spam de renvoi ?

Le trafic de référence, également appelé "hit", est un trafic qui ne provient pas des moteurs de recherche (trafic organique) ou des utilisateurs qui visitent votre site web en entrant son domaine dans leur barre d'adresse (trafic direct).

Parmi les exemples de trafic de référence, on peut citer ceux qui proviennent des sites de médias sociaux ou d'un autre site qui renvoie au vôtre.

Les hits sont enregistrés lorsque les utilisateurs interagissent avec votre site web, mais ils proviennent principalement des visites. Dans Google Analytics, les hits sont enregistrés sous forme de pages vues, d'événements, de transactions, etc. Le spam de référence génère de faux hits qui proviennent principalement de bots ou de faux sites web.

Chaque site web disposant d'un compte Google Analytics possède son propre code de suivi qui l'identifie. C'est pourquoi vous devez ajouter le script Google Analytics aux fichiers de votre site afin que le service enregistre les données de trafic et le comportement des utilisateurs de votre site. Ce code est généralement placé dans l'en-tête, mais il est beaucoup plus facile de l'ajouter par le biais d'un plugin.

Lorsqu'un utilisateur légitime visite votre site web, les données passent par votre serveur avant d'être envoyées à Google Analytics.

Lorsqu'une forme courante de spam de renvoi, connue sous le nom de "ghost spam", se produit, Les attaquants utilisent des scripts automatisés pour envoyer un faux trafic vers des codes de suivi Google Analytics aléatoires. Lorsque ces faux hits sont envoyés à votre code, les données sont enregistrées dans votre système d'analyse en tant que résultat, bien que le trafic n'ait jamais atteint votre site.

Parfois, les faux renvois proviennent de robots d'indexation malveillants. Le trafic envoyé via ce type de spam de renvoi fait passe par votre serveur, mais il ignore les règles du fichier robots.txt de votre site. Le trafic est ensuite envoyé à Google Analytics et enregistré comme un succès.

Comment repérer les spams dans Google Analytics ?

Vous pouvez trouver les spams de référence à côté des autres références enregistrées par Google Analytics pour votre site, en allant dans Acquisition → Tout le trafic → Références.

Certains sites de spam sont faciles à repérer : ils ont généralement des domaines bizarres avec des noms non professionnels, des expressions telles que "gagner de l'argent" ou des références à des contenus pour adultes.

Ils peuvent également comporter de nombreux traits d'union ou utiliser des extensions de domaine non standard. D'autres références de spam ne sont pas aussi faciles à repérer, vous devrez donc utiliser d'autres méthodes.

Par ailleurs, veillez à utiliser une plage personnalisée lorsque vous consultez vos références dans Google Analytics. Réglez-la pour afficher les deux derniers mois au minimum, mais vous pouvez remonter aussi loin que vous le souhaitez. Notez simplement que plus vous remontez dans le temps, plus vous aurez besoin de passer au crible les données.

Comme les hits sous forme de ghost spam ne proviennent pas du serveur réel de votre site, ils ont généralement un taux de rebond de 100 % et des sessions d'une durée de 0 minute et 0 seconde. Cliquez sur la colonne Taux de rebond pour trier les données par taux de rebond le plus élevé afin de vous faciliter la tâche.

Le spam par crawler est beaucoup plus difficile à détecter, car ces robots faire Si vous pensez qu'une URL source dans vos rapports de référence est un spam, ne visitez pas le site pour le confirmer.

Effectuez plutôt une recherche sur Google en mettant le mot entre guillemets ("google.com" par exemple) pour voir s'il a été signalé comme étant du spam.

Si vous visitez ces sites, assurez-vous d'utiliser les dernières versions de navigateurs tels que Chrome et Firefox, qui disposent tous deux de dispositifs de protection contre les sites malveillants. Assurez-vous également que votre ordinateur ou votre appareil est équipé d'un logiciel antivirus actif.

Pourquoi le spam de renvoi est-il mauvais ?

Le rapport "Références" n'est pas le seul endroit où des données provenant de spams s'infiltrent dans Google Analytics. Vous les trouverez dans l'ensemble de vos rapports, en particulier dans la vue d'ensemble où se trouve le nombre total de visites de votre site ou de pages individuelles.

Si vos rapports sont entachés par des occurrences qui ne représentent pas des personnes réelles, vous risquez de prendre des décisions marketing erronées qui conduiront à des campagnes qui ne décolleront pas ou ne rapporteront pas de revenus.

Il convient de noter que, bien que Google ait fait beaucoup pour empêcher le spam de référence d'affecter vos données, il s'agit d'un phénomène courant qui affecte la majorité des sites sur le web.

Bien que vous deviez toujours choisir un hébergeur de qualité, utiliser un plugin de sécurité si vous n'utilisez pas un hébergeur WordPress géré, et n'installer que des thèmes et des plugins provenant de sources fiables, vous ne pouvez pas faire grand-chose pour décourager les spams, car ils n'attaquent pas directement votre site ou ont des moyens de faire passer le trafic pour légitime.

C'est pourquoi nous allons vous montrer comment remédier au spam de référence en le filtrant dans Google Analytics.

Comment corriger le spam de référence dans Google Analytics ?

Les filtres dans Google Analytics sont permanents et les données filtrées ne peuvent pas être récupérées. C'est pourquoi vous devriez toujours créer une vue non filtrée pour votre site, car elle vous permet de voir les données qui peuvent avoir été incorrectement filtrées. Cela vous aide à surveiller la quantité de spam que votre site reçoit, même après avoir appliqué des filtres pour l'éliminer.

La création d'une vue non filtrée pour le compte Analytics de votre site est facile. Commencez par l'écran Admin (le bouton Admin se trouve en bas à gauche), et cliquez sur Paramètres d'affichage dans le panneau Affichage (panneau de droite).

Commencez par renommer votre vue actuelle, qui s'appelle par défaut "Toutes les données du site Web", en "Vue principale" en modifiant le nom dans le champ Nom de la vue. Cliquez sur Enregistrer.

Si vous faites défiler l'écran jusqu'en haut, vous verrez un bouton en haut à droite de l'écran intitulé "Copier la vue". Cliquez dessus, nommez la nouvelle vue "Vue non filtrée" et cliquez sur Copier la vue pour la confirmer.

Vous pouvez également revenir à la vue principale et répéter ce processus pour créer une autre vue appelée "Vue de test", que vous pouvez utiliser pour tester de nouveaux filtres avant de les appliquer à la vue principale.

Vous disposez à présent d'une vue non filtrée, et éventuellement d'une vue de test, dans Google Analytics. Si vous avez appliqué des filtres à votre vue principale, supprimez-les de la vue non filtrée et de la vue de test. Si vous ne l'avez pas fait, vous recevrez une notification de Google Analytics concernant des vues redondantes, que vous pouvez ignorer en toute sécurité.

Un filtre unique pour lutter contre les spams liés à des renvois fantômes

Vous avez déjà identifié des URL de spam dans vos rapports de référence. De nombreux webmasters créent des filtres pour empêcher ces URL d'apparaître dans leurs rapports.

Malheureusement, les spammeurs utilisent rarement un seul nom de source dans leurs attaques, ce qui signifie que vous devrez créer de nouveaux filtres en permanence pour bloquer tout nouveau spam apparaissant dans vos rapports.

Vous devriez plutôt créer un filtre qui n'inclut que les données provenant de noms d'hôtes réels.

Derrière chaque domaine se trouve l'ordinateur et le réseau auxquels il est rattaché, qui peuvent être identifiés par une adresse IP. Ces adresses IP reçoivent des "noms d'hôte" uniques qui les identifient par des noms alphanumériques faciles à retenir.

Le préfixe "www" est un nom d'hôte, comme tous les domaines du web, puisqu'ils sont tous deux connectés à des ordinateurs ou à des réseaux dotés d'une adresse IP.

Les spams fantômes sont envoyés à des codes de suivi Google Analytics aléatoires plutôt qu'aux noms d'hôtes liés à votre site, ce qui signifie qu'ils utilisent de faux noms d'hôtes. Il est donc beaucoup plus efficace de filtrer les références qui utilisent de faux noms d'hôtes.

Le filtre que nous allons créer supprimera également les faux hits créés par de faux noms d'hôtes dans vos rapports de mots-clés, de pages vues et de trafic direct.

Création d'une expression régulière pour votre filtre

Nous allons créer un filtre qui n'inclura que les hits provenant de noms d'hôtes valides afin d'exclure les faux. Cela signifie que vous devrez créer une liste de noms d'hôtes valides associés à votre site.

Si vous avez appliqué des filtres à votre vue principale, passez à la vue non filtrée que vous avez créée précédemment. Vous trouverez les noms d'hôte identifiés par Google Analytics en allant dans Audience → Technologie → Réseau et en changeant la dimension primaire en Nom d'hôte.

Voir également: 12 conseils avisés pour les nouveaux blogueurs (ce que j'aurais aimé savoir il y a 10 ans)

Voici une liste des types de noms d'hôtes à inclure dans vos rapports :

  • Domaine - Il s'agit du nom d'hôte principal utilisé pour identifier votre site sur le web et celui par lequel les renvois légitimes passeront, il doit donc être inclus. Vous pouvez ignorer tous les sous-domaines que vous avez créés car ils seront couverts par votre domaine principal.
  • Outils et services - Il s'agit d'outils que vous utilisez sur votre site web et que vous avez peut-être reliés à votre compte analytique afin de collecter des données pour vos campagnes. Il s'agit d'outils tels que votre fournisseur de services de marketing par courrier électronique, les passerelles de paiement, les services de traduction et les systèmes de réservation, mais les outils externes, tels que YouTube, que vous avez intégrés à votre compte comptent également.

Dressez une liste de tous les noms d'hôte valides associés à votre site en vous basant sur ces conseils, en veillant à ce que chaque nom corresponde à ce qu'il apparaît dans le champ Nom d'hôte. Excluez les noms d'hôte suivants :

  • Noms d'hôtes non définis
  • Environnements de développement, tels que localhost ou le sous-domaine de votre environnement de mise en scène
  • Sites d'archivage et de scraping
  • Les noms d'hôte qui semblent légitimes mais qui sont soit des sites que vous ne possédez pas, soit des outils et des services qui ne sont pas intégrés à votre compte Google Analytics. Il s'agit probablement de spams déguisés en sources légitimes.

Vous devriez maintenant avoir une liste de noms d'hôtes valides de sources que vous gérez ou utilisez avec votre compte Analytics. Vous devez maintenant créer une expression régulière, ou "regex", qui combine tous ces noms.

Une expression régulière est une chaîne de texte spéciale permettant de décrire un modèle de recherche. Ce modèle de recherche est une liste de noms d'hôtes valides dans ce cas. Google Analytics utilisera cette expression pour identifier les noms d'hôtes que vous souhaitez inclure dans vos données après avoir créé votre filtre.

Voici un exemple de ce que devrait être votre expression :

 votredomaine.com 

Le tuyau sont importants, car ils signifient OR et aident Google Analytics à distinguer chaque nom d'hôte. Vous ne devez jamais insérer de caractères pipe au début ou à la fin d'une expression, donc ne commencez pas et ne terminez pas votre expression régulière par .

Création du filtre

Accédez à l'écran d'administration et passez à la vue test si vous en avez créé une. Passez à la vue maître si ce n'est pas le cas.

Cliquez sur le lien Filtres dans la colonne de droite Affichage, puis cliquez sur le bouton rouge Ajouter un filtre. Voici une liste rapide de la façon de configurer ce filtre :

  • Méthode : Créer un nouveau filtre
  • Nom : Quelque chose de descriptif, comme "Noms d'hôtes valides"
  • Type de filtre : Sur mesure
    • Assurez-vous que l'option Inclure est sélectionnée
  • Champ du filtre Nom d'hôte
  • Modèle de filtre : Copiez et collez votre expression ici, en veillant à ce qu'il n'y ait pas d'espace.

Une fois que vous avez collé votre expression dans le champ Filtre, cliquez sur le lien Vérifier ce filtre pour voir si les noms d'hôtes indésirables seront filtrés correctement. Cliquez sur Enregistrer pour créer le filtre une fois que vous avez terminé.

Si tout va bien, répétez le processus avec votre vue principale et supprimez la version de test.

Filtrer le spam des robots d'indexation

Certains spammeurs utilisent des robots d'indexation pour envoyer de fausses visites sur votre site. De plus, certains outils tiers que vous utilisez, notamment des outils de gestion de projet et de surveillance de site, fonctionnent via des robots d'indexation s'ils sont intégrés à votre site.

Vous pouvez bloquer ce type de spam en créant une expression similaire, mais en utilisant des noms de source au lieu de noms d'hôte. Naviguez vers Audience → Technologie → Réseau, et ajoutez Source comme dimension secondaire.

Voici deux expressions préconstruites différentes que vous pouvez utiliser à partir du site de Carlos Escalera Alonso si vous voulez vous faciliter la tâche.

Expression 1 :

 semalt 

Expression 2 :

Voir également: Iconosquare Review 2023 : Bien plus qu'un outil d'analyse des médias sociaux
 (artblog 

Vous devrez examiner vos URL sources pour déterminer les outils qui envoient des robots d'indexation sur votre site et créer votre propre expression pour eux.

Lorsque vous ajoutez ces filtres à vos vues test et maître, utilisez Exclure comme type de filtre et Source de la campagne comme champ de filtre.

Dernières réflexions

Le spam de renvoi peut faire des ravages dans les analyses de votre site. Il peut donner l'impression que vous avez plus de visites et un taux de rebond plus élevé que ce n'est le cas. C'est pourquoi il est important de bloquer le spam de renvoi dans vos rapports.

Assurez-vous d'avoir trois vues différentes pour votre site - une vue principale, une pour les données non filtrées et une pour les tests. Vérifiez à nouveau la zone des filtres pour votre vue non filtrée afin de vous assurer qu'il n'y en a pas, car il est important que vous contrôliez ce qui est bloqué.

Bien que cet article se concentre sur le spam de renvoi, il est important de noter qu'il existe d'autres façons de filtrer le spam dans Google Analytics. Par exemple, vous pouvez utiliser le guide ci-dessus pour trouver et filtrer le spam pour les rapports suivants :

  • Langue
    • Type de filtre : Paramètres linguistiques
  • Renvoi
    • Type de filtre : Source de la campagne*
  • Mot-clé organique
    • Type de filtre : Terme de recherche
  • Prestataire de services
    • Type de filtre : Organisation ISP
  • Domaine du réseau
    • Type de filtre : Domaine ISP

Remarque : Si vous souhaitez filtrer les spams par source, pensez à ajouter des éléments de la liste noire de Matomo (spammers.txt).

Lecture connexe :

  • 5 puissants plugins d'analyse et de statistiques pour WordPress
  • Comparaison des meilleurs outils d'analyse de sites web

Patrick Harvey

Patrick Harvey est un écrivain chevronné et un spécialiste du marketing numérique avec plus de 10 ans d'expérience dans l'industrie. Il possède une vaste connaissance de divers sujets tels que les blogs, les médias sociaux, le commerce électronique et WordPress. Sa passion pour l'écriture et pour aider les gens à réussir en ligne l'a poussé à créer des articles perspicaces et engageants qui apportent de la valeur à son public. En tant qu'utilisateur WordPress expérimenté, Patrick connaît les tenants et les aboutissants de la création de sites Web réussis, et il utilise ces connaissances pour aider les entreprises et les particuliers à établir leur présence en ligne. Avec un sens aigu du détail et un engagement inébranlable envers l'excellence, Patrick se consacre à fournir à ses lecteurs les dernières tendances et conseils dans l'industrie du marketing numérique. Lorsqu'il ne blogue pas, on peut trouver Patrick en train d'explorer de nouveaux endroits, de lire des livres ou de jouer au basket.