Google Analytics est un excellent indicateur de performance de votre site. Mais ses résultats sont de plus en plus faussés par le fléau des sites référents.

Étiquettes : ,

Google Analytics est un excellent indicateur de performance de votre site. Mais ses résultats sont de plus en plus faussés par le fléau des sites référents.

Avez-vous remarqué un certain nombre de sites référents inexpliqués dans vos rapports Google Analytics récemment ? Cela est certainement dû à des sites référents malveillants (referrer spam).

Bots vs humains : qui dirige le web ?

Si vous surveillez régulièrement les statistiques de votre site web, vous avez probablement dû constater une augmentation des visites récemment. Chose qui devrait normalement vous réjouir. Mais si cela vous arrive, vous devriez plutôt vous méfier. Ces visites proviennent-elles de vrais humains ou de bots ?

Aujourd’hui, les robots sont plus actifs que jamais et représentent jusqu’à 50% du trafic web. Mais bien sûr, tous les bots ne sont pas mauvais. Certains d’entre eux aident à améliorer notre expérience utilisateur sur le Web. Prenez par exemple Googlebot. C’est un bot utile qui indexe le contenu et les pages Web dans le moteur de recherche de Google pour nous aider à trouver plus vite ce que nous recherchons.

Mais, d’autres bots n’ont pas de si bonnes intentions. Ils effectuent des fonctions malveillantes et provoquent la confusion dans le système de reporting web analytics. Google Trends a récemment révélé une augmentation exponentielle des bots malveillants dans les requêtes de moteur de recherche impliquant des sites référents. Mais aussi des « visites fantômes » (ghost referral spam), qui sont encore plus difficile à contrôler.

Sites référents et visites fantômes : des bots malveillants qui interfèrent avec vos analyses

Les « faux » sites référents, ou les visites fantômes, sont un type très spécifique de spamdexing (spamming visant les requêtes de moteur de recherche). Dans le domaine du web analytics, c’est une tendance croissante qui consiste à augmenter le nombre de visites sur un site Web en provenance d’une source référée. En d’autres termes, les sites référents factices désignent une fausse source de trafic qui fait semblant de rediriger les visiteurs vers votre site. Ce qui vous donne une fausse image de votre popularité.

Cette technique des sites référents factices implique d’envoyer des requêtes répétées en utilisant une fausse URL de référencement vers le site Web ciblé. Le but de ces spammeurs est double :

  • Améliorer leur classement sur les moteurs de recherche en indexant (via les logs d’accès) ces faux liens générés en vrac.
  • Et générer des revenus en incitant les webmasters et les spécialistes du marketing Web à visiter les sites Web malveillants signalés comme référents dans leur rapport d’analyse.

Au fil des ans, les bots de sites référents sont devenus de plus en plus sophistiqués. La dernière génération de bots agissant comme référents fantômes envoie des fausses données de visite sans même visiter votre site Web. Ils se procurent simplement votre code de suivi analytique ou votre ID propriétaire Google Analytics, qui est une information publique. Ce type de spam analytics est particulièrement nuisible. Car il est « immunisé » contre les méthodes habituelles pour gérer les sites référents.

Comment les données de sites référents affectent les analyses ?

Les bots de spam compromettent les analyses de cinq manières principales :

  • Influence sur la précision de vos données.
  • Baisse de votre taux d’engagement.
  • Réduction de la qualité du trafic de votre site.
  • Augmentation de votre taux de rebond (jusqu’à 100%).
  • Réduction du temps moyen passé sur une page (environ 1 s) et de la durée des sessions (environ 0 s).

En d’autres termes, les spam analytics vous donnent une fausse impression de succès tout en dégradant le reste de vos données les plus pertinents et utiles.

Nettoyer les données d’analyse est plus critique que jamais, peu importe la popularité ou la taille de votre site Web, ou même l’ancienneté de votre site Web. Les sites référents spam peuvent affecter les sites Web récemment créés. Bien avant qu’ils aient gagné en popularité.

En fait, plus votre site est petit, ou moins vous avez de visiteurs, plus l’impact des sites référents sera grand sur les statistiques. Si vous avez un grand site Web avec des dizaines de milliers de visiteurs journaliers, les faux liens référents seront compensés par vos données backlinks réelles. Mais quelle que soit la taille ou la popularité de votre site, l’impact des sites référents est important et ne doit pas être négligé.

Heureusement, il existe des solutions qui peuvent vous permettre d’ignorer les sites référents factices et les visites fantômes. Et même vous aider à restaurer l’intégrité passée de vos données.

Comment traiter les sites référents dans les rapports Google Analytics

Voici un bref aperçu des méthodes les plus courantes pour traiter le spam analytics, et leurs niveaux d’efficacité:

Un filtre dans le champ « Sites référents »

Une solution répandue consiste simplement à créer un filtre basé sur les critères du champ Sites Référents. Mais cela semble trop beau pour être vrai. Et c’est malheureusement le cas ! Cette approche est en effet inefficace parce que les spammeurs changent régulièrement les sites référents qu’ils utilisent. Vous devrez constamment mettre à jour votre filtre, ce qui est une solution inefficace, qui ne résout pas le problème. Certaines personnes recommandent d’utiliser un filtre basé sur le champ « Source de la Campagne ». Le problème c’est que ce champ n’est souvent pas explicitement mentionné. De sorte que Google Analytics utilise automatiquement le référent par défaut.

Un filtre dans le champ « Nom d’hôte »

Une autre approche consiste à définir un filtre basé sur le champ Nom d’hôte. Mais comme nous l’avons vu précédemment, les spammeurs peuvent envoyer de fausses données, sans cibler aucun nom d’hôte de site lié à un ID Google Analytics. En créant une liste blanche basée uniquement sur le champ nom d’hôte, vous risquez de filtrer accidentellement de vraies visites. Pas une bonne idée !

Un filtre dans le champ « URI de la demande »

Il s’agit d’une technique plus déductive basée sur l’hypothèse que les sites référents ciblent la page d’accueil du site. La solution consiste donc à remplacer l’URI de la page d’accueil (/) dans le code Javascript de Google Analytics par une alternative comme « /index.php ». Ce faisant, vous pouvez ignorer en toute sécurité les sites référents factices en créant un filtre qui exclut toutes les pages vues avec le champ « URI de la Demande » utilisant « / ». Mais un problème majeur avec cette approche c’est qu’elle introduira de la discontinuité dans les données de page d’accueil. Pour contourner ce problème, vous pouvez exécuter un autre filtre pour changer automatiquement « /index.php » en « / » dans vos analyses.

Custom dimension

Vous pouvez utiliser Custom dimension dans le cas où les spammeurs commencent à cibler des pages autres que /. Cette technique vise à modifier le code de suivi afin d’éviter ce comportement spécifique. Et elle permet d’envoyer une valeur corrélée et filtrable à Google Analytics pour toutes les pages vues. Mais même cette approche n’est pas complètement sûre et durable.

Investir dans des outils analytiques plus propres pour bloquer le spam analytics

L’équipe de développement d’Emolytics a mis en place des mesures de sécurité robustes et efficaces dans son outil d’analyse. Les sites référents malveillants visent souvent des fournisseurs spécifiques tels que Google Analytics. De sorte que leur outil d’analyse est naturellement immunisé contre les robots de spam.

Mettre des bâtons dans les roues des mauvais robots est leur credo. Ils ont mis en place un filtre pour protéger les IP contre les bots de sites référents bien connus ou détectés en direct. Ils vérifient et filtrent toutes les données et ils s’assurent que le domaine et l’ID sont suffisamment sécurisés pour prévenir les comportements malveillants. Contrairement à Google Analytics, il est impossible d’analyser l’ID avec la solution Emolytics. Ce qui rend le trafic de sites référents plus difficile ou impossible à mettre en œuvre.

Leurs clients ont déjà vu des améliorations significatives en comparant leurs rapports Google Analytics avec les données optimisées Emolytics. Un certain nombre de statistiques clés sont nettement plus pertinentes et réalistes. En particulier en ce qui concerne le taux de rebond, le temps de session et le nombre de visites.

Conclusion

La morale à cette histoire de bots ? Bloquer les sites référents factices, en particulier les « visites fantômes », demande du temps et des efforts. Mais le spam analytics est un problème crucial qui doit être résolu si vous voulez préserver la validité de vos indicateurs de performance et atteindre vos objectifs marketing.


Devenez chroniqueur

Vous souhaitez devenir chroniqueur ou nous soumettre un article? Rien de plus simple.

Ça m'intéresse

#EPW sur Twitter

#EPW sur Facebook

À propos

Votre blog Écrire pour le web en chiffres
  • Plus de 25.000 sessions par mois
  • Plus de 35.000 pages vue chaque mois
  • 1500 abonnés à la newsletter
  • Créé en 2006
  • 1e position dans Google sur des expressions métier
En savoir plus