Le duplicate content selon Google correspond à des blocs de texte au sein d’un même domaine ou de sites distincts, présentant une similarité inquiétante, voire étant purement identiques. Pour éviter ce genre de situation, des solutions existent. Si vous comprenez les bases pour reconnaître et combattre le contenu usurpé, vous ne subirez aucun inconvénient en termes de référencement.

2 types de duplicate content, bête noire du SEO

Quand vous rédigez, comme nombre d’équipes de rédacteurs, il flotte au-dessus de votre clavier cette petite musique lancinante vous mettant en garde contre le contenu dupliqué…
Qu’est-ce exactement que ce fantôme toujours en trame de fond dans les discussions SEO ?
Un texte copié et collé plusieurs fois au sein d’un site, c’est du duplicate content ou contenu dupliqué en bon français. La répétition de mêmes phrases devient un problème à la fois pour les moteurs de recherche et pour les internautes. Mais, si votre concurrent s’octroie le droit de voler votre article pour l’insérer dans son propre site, là encore c’est du plagiat. La vigilance doit être accrue à la fois pour lutter contre l’une et l’autre formes de contenu copié :

  • duplicate content interne ou intrasite : tout texte présent en double (ou plus) sur un même site.
  • duplicate content externe ou extrasite : contenu volé et retrouvé sur une page d’un autre site internet.

Les conséquences du duplicate content pour un site

Le contenu dupliqué va influer sur l’indexation des pages d’un site par les moteurs de recherche.
Les algorithmes possèdent des filtres détectant les contenus similaires.
La conséquence première est de voir la page incriminée chuter dans les résultats de requêtes.
Vous comprendrez donc que le duplicate content est totalement contre-productif dans le référencement naturel.

Sachez que dupliquer du contenu engendre également une baisse de l’image de marque en ligne, ou e-réputation.
La crédibilité d’un site où des articles se répètent, ou pire, où les textes sont totalement les mêmes que chez le concurrent, va chuter, et les internautes ne visiteront plus vos pages.

Le plagiat avéré est enfin sanctionné par Google. Avec les preuves d’antériorité du contenu, des liens propres et une alimentation rédactionnelle fraîche, un site copié peut faire-valoir sa légitimité. À l’inverse, le site copieur verra soit un déclassement, soit une désindexation.

Conseils afin d’éviter les problèmes de duplicate content

Hormis de déléguer la rédaction de vos contenus à une équipe de rédacteurs professionnels engagés à un contenu 100 % inédit, le travail d’optimisation d’un site est un labeur constant, une sorte de puits sans fond !
Il faut respecter les règles de SEO tout en restant authentique pour le plaisir des lecteurs. Pour cela des pistes simples existent :

Pour le contenu interne :

  • Utilisez des Titles et Méta descriptions spécifiques à chaque page
  • N’indexez pas tous les contenus pour éviter tout risque de pages doublon
  • Évitez le copié/collé au sein de votre site ; même un petit bout de texte repris sera vite repéré par les moteurs qui attendent du contenu unique quoi qu’il advienne
  • Mettez en place une balise canonical : ainsi vous identifiez la page de référence ; une page lui ressemblant sera alors vue comme « à ne pas indexer ». Très utile en e-commerce pour les déclinaisons couleurs d’un même produit par exemple

Pour le contenu externe :

  • Soyez vigilants, si vous avez plusieurs sites, à ne pas y inclure le même contenu
  • Prenez garde lors de refonte de site ou de migration de nom de domaine : plutôt que des redirections anarchiques conduisant sans aucun doute à des doublons, pensez à une redirection 301
  • Faites valoir vos droits si vous êtes victime de pillage de contenu : demandez au propriétaire du site la suppression ou la mise en nofollow de la/les page.s en question
  • Utilisez votre dernier recours si jamais aucune réponse ne vous arrive avec l’outil de plainte de Google désindexation

Le top 3 des solutions gratuites anti contenu plagié

L’intérêt est grand de vérifier que vos textes ne sont pas des reprises de contenu déjà en ligne, mais c’est également important de scanner l’internet pour s’assurer que l’on ne vous a pas volé d’articles (tout ou partie).

Pour cela, testez sans attendre ces logiciels, outils incontournables pour être certain de la primauté de vos textes. C’est une pratique SEO à adopter pour tout rédacteur traquant le duplicate content :

Quetext : outil anti-plagiat en anglais permettant de copier-coller le texte d’une page dans le moteur de recherche. Il joue également le rôle de chercheur de pages web similaires aux vôtres. Pour cela, cochez l’option « calculate similary score ».

Duplicate Content Checker : idéal pour déceler le plagiat ; ergonomique, l’utilisation est intuitive et la recherche de contenu copié s’effectue à partir d’une URL ou d’un texte. Bien qu’en anglais, le logiciel tient compte des résultats en français.

Positeo : la solution la plus plébiscitée. Rapide et facile à utiliser, il sort des résultats fiables et précis. Copiez l’URL ou l’extrait d’article et obtenez une liste de pages web potentiellement dupliquées. L’information supplémentaire est un pourcentage de contenu copié et un affichage couleur pour faire ressortir les plagiats les plus forts.

Un article d’Anabelle Martinez-Maingraud pour SEOmantique