a kind of duplicate content

Étiquettes : , , ,

Voilà des années que les duplicate content font la joie des uns et empoisonnent la vie des autres. Revenons sur le phénomène qui a fait grogner Google.

Panda, voici le nom que Google a donné à la dernière mise à jour de son algorithme. Son arrivée sonnait le glas (en théorie) des contenus dupliqués (ou duplicate content, en anglais, aka DC).

Vous êtes bien placés pour le savoir : le combat contre le DC est long et sans relâche. Serait-il perdu d’avance ? Les avis sont mitigés. Il existe plusieurs outils pour traquer, lutter et tenter d’éradiquer chaque contenu dupliqué.

Depuis quelques années, les plug-ins sortent de l’ombre, les tips and tricks foisonnent : c’est le moment idéal pour un débriefing dans les règles de l’art.

Définition du contenu dupliqué

Rien de tel qu’une mise en situation concrète pour appréhender au mieux le problème. Google, Bing, Yahoo, et les autres moteurs de recherche, indexent continuellement un nombre incalculable de nouvelles pages. Souvent, ils démasquent un ou plusieurs sosies d’une page déjà présente dans leurs bases de données. Ce sont nos duplicate content.

La stratégie du Panda face aux DC

Avoir des doublons, les moteurs de recherche n’aiment pas. Ils vont donc décider de ne garder qu’un exemplaire parmi toutes ces pages (à la troublante ressemblance).
Heureusement, ils parviennent à faire la différence entre des DC pertinents (articles de presse, pages produits des sites e-commerce, forums de discussion, etc. ), et les autres.

Pour lutter contre ces contenus parasites, Panda (et ses équivalents) va déterminer lesquels d’entre eux est « l’original ». Pour ce faire, il évaluera la popularité (TrustRank et PageRank) ainsi que la présence d’une éventuelle balise « canonical », insérée dans le code par vos soins.

Le contenu qui répondra le plus à ces critères sera indexé par les moteurs de recherches. Ses doublons seront, quant à eux, relégués dans l’index secondaire et n’apparaitront donc plus dans les pages de résultats.

A suivre

Dans la seconde partie, nous abordons les différents types de contenus dupliqués, rendez-vous sur « Les contenus dupliqués au menu du panda 2/3 » pour en savoir plus!


Commentaires

  1. Avatar Cédric dit :

    Pour identifier l’original, Google prend en compte également la date d’indexation de l’article.

  2. tout à fait Cédric, c’était d’ailleurs l’une des toutes premières stratégies de Google pour lutter contre les DC. Cependant, des tests ont démontré que le simple droit d’aînesse ne suffisait plus. Voici le lien de l’article en question: http://blog.axe-net.fr/contenu-duplique-et-reseaux-sociaux-test-seo/

  3. Avatar Cédric dit :

    Merci le test sur le blog Axe-net est tres interessant.
    Les réseaux sociaux vont certainement prendre de plus en plus d’importance…

  4. Avatar Cédric dit :

    dommage qu’on ne puisse pas être alerté de nouveaux commentaires 🙁
    dans wordpress il y a une extension tres simple à mettre en place 😉
    A bientot

  5. Les désirs de nos lecteurs sont des ordres: plugin installé 🙂

  6. Ping : Plus de trafic sur votre site Web? | OppiaOppia

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Devenez chroniqueur

Vous souhaitez devenir chroniqueur ou nous soumettre un article? Rien de plus simple.

Ça m'intéresse

#EPW sur Twitter

#EPW sur Facebook

À propos

Votre blog Écrire pour le web en chiffres
  • Plus de 25.000 sessions par mois
  • Plus de 35.000 pages vue chaque mois
  • 1500 abonnés à la newsletter
  • Créé en 2006
  • 1e position dans Google sur des expressions métier
En savoir plus