Eviter le Duplicate Content
Phénomène que l'on nomme la "dilution du PR"
Plusieurs facteurs peuvent entrer en ligne de compte. Le principal étant le phénomène de "duplicate content". Le "duplicate content" n'est généralement pas fait expré. Le Robot de Goolge, "Googlebot" considère l'exemple suivant comme étant 3 pages différentes :
http://nomdusite.tld/
http://www.nomdusite.tld/ (ou "www" correspond à un sous-domaine).
http://www.nomdusite.tld/index.sufix, (html, htm, php, asp).
Bien que ces trois URL's pointent sur la même page. "Googlebot" les considère comme étant 3 pages différentes, d'où le faite qu'il peut y avoir dilution du PageRank. (Ce malgré le fait qu'en principe Googlebot déffinit pour un site ce que l'on appel l'URL canonique d'un site). Pour éviter ce problème de "duplicate content" :
- On veillera à référencer, (campagne SEO, inscriptions auprès des annuaires, échanges de liens...), l'URL de son site systématiquement soit avec "www" soit sans "www", mais pas les deux. (www étant considéré comme un sous-domaine du nom de domaine). Mais il faut bien faire attention à ne pas référencer les deux. Notez au passage que pas mal de gens font exprès de proposer leurs sites avec et sans "www". Ceci à fin de looser les administrateurs d'annuaires et d'avoir ainsi plusieurs fois leurs sites indexé sur les mêmes annuaires dans des catégorie différente. Il ne le savent peut être pas mais cela pénalise leurs sites plus qu'autre chose. Car les robots des moteurs de recherche eux ne si trompent pas.
- On indiquera pas le fichier "index.ext" dans ses URL's et liens internes, les navigateurs, les robots des moteurs de recherche, ainsi que les scripts d'annuaires et autres logiciels de référencement identifient automatiquement le fichier index de tout sites Web. Qu'il soit à la racine ou dans un sous-répertoire. Pour s'assurer que les personnes qui font des liens spontanément vers votre site, le fasse comme il ce doit. Proposez une page avec des codes de liens déjà près, (intitulé généralement : "Faire un lien"), exemple la page faire un lien de PageRankInfo : Faire un lien. Les internautes et webmasters n'aurons plus qu'à copier/coller un de vos codes liens déjà existant. C'est un très bon moyen de s'assurer au minimum du contenu des l'URL qui seront utilisé pour les liens externes pointant vers votre site.
- Enfin la meilleure solution, (avec la page "Faire un Lien"), consistera à utiliser une redirection 301, (redirection permanente). La redirection 301 permettra quelque soit la composition des liens qui pointent vers votre site. De s'assurer qu'ils aboutirons sur : http://www.nomdusite.tld. Pour cela il faut que votre hébergeur supporte le PHP. Voir si dessous à ce sujet. La redirection 301 peut ce faire directement dans vos fihier PHP et/ou dans un fichier ".htaccess".
- Enfin dans la navigation interne à votre site, évitez d'indiquer dans les liens interne pointant vers votre page d'accueil, le fichier index.
A proscire : <a href="index.ext">Accueil</a> !!!
Utilisez plutôt la syntaxe suivante : <a href="./">Accueil</a>.
Redirection 301 avec PHP
Code à placer au début de vos page en PHP, (remplacez "nomdusite.tld" par l'URL de votre site) :
Ce bout de code redirigera les URL : http://www.nomdusite.tld/index.php et http://nomdusite.tld vers http://www.nomdusite.tld
Redirection 301 par fichier .htaccess
Pour ce faire il faut que votre site soit hébergé sur un serveurs utilisant APACHE, (remplacez "domaine.com" par votre nom de domaine) :
Attention la manipulation des fichiers .htaccess n'est pas anodine. Pensez à faire une sauvegarde de votre .htaccess avant tout manipulation de ce dernier.
Je vous inviter à visité : ANNUAIRE-INFO.COM et URLREWRITING.FR pour apprendre plus en détails les rêgles de redirections et de ré-écriture d'url par ".htaccess et PHP".