Erreurs de duplicate content
Par Brice, 23 avril 2009 | Référencement
Le duplicate content, s’agit de page web identique accessible via plusieurs adresses. Dans la plus part des cas, on est même pas au courant. Mais cela a pour conséquence de discréditer votre site envers les moteurs de recherches, car ceux-ci considère qu’on ne peu pas définir lequel doit avoir les points. Voici une liste d’erreurs de duplicate content à ne pas commettre.
Erreur n°1 : Site accessible avec et sans www
C’est l’erreur de base qui peu couter cher ! Souvent les webmasters laisse ont l’accès a leur site avec ou sans les www, cela même sans vraiment s’en rendre compte, malheureusement sa signifie alors une double indexation, pour le même site, et ont a la une belle duplication de tout le site.
La solution consiste a rediriger l’un vers l’autre, avec la redirection 301, via le .htaccess comme ceci :
RewriteCond %{HTTP_HOST} !^www\.domaine\.fr [NC]
RewriteRule (.*) http://www.domaine.fr/$1 [QSA,R=301,L]
Ou avec un code php psi votre hébergeur n’autorise pas le mod_rewrite :
$request_uri=$GLOBALS['REQUEST_URI'];
$domaine=$_SERVER["HTTP_HOST"];
$sous_domaine=substr($domaine,0,strpos($domaine,”.”));
if ($sous_domaine!=”www”)
{
$url=”http:/www.URL-DE-VOTRE-SITE.com”;
// pour les robots on peu evidemment ajouter cela :
header(”HTTP/1.1 301 Moved Permanently”);
header(”Location: “.$url);
header(”Connection: close”);
exit;
On peu aussi utiliser le meta canonical.
Erreur n°2 : Double url pour la page d’index
Voici un exemple d’erreur à corriger très vite :
http://www.nomdedomaine.com/ ou http://www.nomdedomaine.com/index.html
En effet c’est deux url distinct sont la même page, c’est pourquoi il est préférable de ne pas mettre vos liens vers la page d’accueil vers index.html. Voici une solution pour une redirection 301 sous htaccess :
RewriteRule index\.html$ http://www.domaine.fr/%1 [R=301,L]
Et une solution php :
<?php
$url = $_SERVER["REQUEST_URI"];
if($url==’/index.html’){
header(”HTTP/1.1 301 Moved Permanently”);
header(”Location: http://”.$_SERVER['HTTP_HOST'].”/”);
}
?>
Attention ce code doit absolument être au tout début de votre fichier, avant toute ligne HTML.
Erreur n° 3 : Plusieurs noms de domaines pour un site
Acheter plusieurs noms de domaines pour un même site est main courante, cela permet de viser plusieurs extensions (.fr, .com, …), ou réserver des adresses plus courtes a retenir, etc.
Il ne faut surtout pas qu’ils soit tous indexés, pour cela vous pouvez faire la redirection 301 via htaccess vers votre domaine principal.
Erreur n° 4 : Avoir 2 Url pour la page 1 (pagination)
Avoir une page web qui pagine pour éviter la longueur, c’est bien mais il faut faire attention de ne pas avoir 2 url pour la page 1, voici un exemple à éviter :
Page par défaut : http://www.domaine.fr/page.html
Page 2 : http://www.domaine.fr/page-2.html
Page 1 en revenant de la page 2 : http://www.domaine.fr/page-1.html
On à donc 2 url pour la page 1, et les deux seront indexé, il faut donc empêcher cela soit en modifiant vos codes, ou on faisant une redirection 301 pour éviter le duplicate content.
Erreur n° 5 : 2 type d’Url indexables (réécrites et classiques)
Quand on fait une réécriture d’url d’une page web, il faut s’assurer que l’ancienne url n’est plus utilisée dans vos liens, sinon vous aurez une page dupliqué qui pourra avoir un malus de pertinence.