www.jjsworld.fr

Le site d un développeur - administrateur web

  • Full Screen
  • Wide Screen
  • Narrow Screen
  • Increase font size
  • Default font size
  • Decrease font size

Référencement de site Intenet : les sitemaps

Envoyer Imprimer PDF
globe Dans ce troisième article dédié au référencement de site Internet, nous allons nous intéresser aux fichiers sitemap. Qu'est ce que c'est ? A quoi servent-ils ? Comment les utiliser ?

Qu'est ce qu'un fichier sitemap ?

Un sitemap est un fichier au format XML qui décrit l'arborescence des pages de votre site Internet. Voici un exemple de fichier sitemap pour illustrer cette définition :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.jjsworld.fr/blog</loc>
</url>
<url>
<loc>http://www.jjsworld.fr/blog/15-joomla/108-sortie-de-joomla-1517</loc>
<priority>0.5</priority>
<changefreq>weekly</changefreq>
 
<lastmod>2010-05-06</lastmod>
</url>
<url>
<loc>http://www.jjsworld.fr/blog/15-joomla/107-sortie-de-joomla-1516</loc>
<priority>0.5</priority>
<changefreq>weekly</changefreq>
<lastmod>2010-04-27</lastmod>
 
</url>
<url>
<loc>http://www.jjsworld.fr/blog/15-joomla/89-publication-de-la-version-13-</loc>
<priority>0.5</priority>
<changefreq>weekly</changefreq>
<lastmod>2010-03-10</lastmod>
</url>
</urlset>

Comme vous avez pus le constater, chaque page est associée a quelques informations complémentaires qui seront utilisées pour affiner le référencement de votre site Internet :
  • loc : URL complète de la page
  • priority : priorité d'indexation par rapport aux autres pages
  • changefreq : fréquence de modification de la page
  • lastmod : date de dernière modification de la page

A quoi ça sert ?

Le fichier sitemap facilite le travail des moteurs de recherche en leur fournissant la liste des pages de votre site. En effet, par défaut, les robots d'indexation tentent d'indexer votre site en analysant les liens hypertexte présents dans vos pages. Il peut arriver que ces liens ne soient pas "compris" par les robots (liens en Javascript ou dans une animation Flash par exemple). Dans ce cas, certaines pages de votre site pourraient ne pas être indexées... De plus, le fichier sitemap inclu des informations sur la fréquence et la priorité d'indexation, une granularité intéressante quand on souhaite affiner le référencement de sont site Internet.
 

Comment générer son sitemap ?

Il existe plusieurs méthodes pour générer un fichier sitemap. La méthode idéale est celle qui permet de générer le fichier sitemap à la demande, ce qui évite les modification ou générations manuelles.

Manuellement

Si votre site ne comporte pas beaucoup de pages et que vous ne comptez pas le faire évoluer, vous pouvez créer votre fichier sitemap à la main. Prenez comme modèle l'exemple ci-dessus et remplacez les URL par celle des pages de votre site. Attention quelques précautions s'imposent :
  • Le fichier doit être au format UTF-8 (dans le cas contraire, il faudra modifier l'en-tête du fichier XML)
  • Les URL ne doivent pas contenir de caractères spéciaux (remplacez le "&amp;" par son équivalent HTML "&amp;amp;"

Outil web

Il existe des outils en ligne qui permettent d'analyser les liens présents dans votre site et de générer le fichier sitemap. Principal avantage : le gain de temps. Par contre, il existe pas mal d'inconvénients qui rendent cette méthode peu recommandable dans la plupart des cas :
  • certaines pages ne seront pas trouvées (liens Javascript, animations Flash...)
  • pas toujours de granularité pour le paramétrage
  • doublons de page
Rien ne vous empêche d'utiliser un de ces outils pour générer un modèle de sitemap et de le modifier ensuite manuellement pour l'adapter à vos besoins.  Vous en trouverez facilement avec votre ami Google.

Plugin CMS

Si vous avez la chance d'utiliser un CMS, sachez que la plupart proposent un plugin qui permet de créer le fichier sitemap. C'est la meilleure méthode car un simple appel d'une URL sur votre site génère aussitôt le fichier sitemap à jour avec l'arborescence complète de votre site !

C'est ce que j'utilise pour JJ's World : cliquez ici pour afficher le sitemap du site ;-)

Si, comme moi, vous utilisez Joomla, je vous vous conseille d'utiliser SEF Service Map que vous pouvez télécharger en cliquant ici.

Comment déclarer son sitemap ?

Lorsque votre sitemap est prêt, il faut le publier sur votre site. Deux possibilités :
  • vous avez généré un fichier XML physique, dans ce cas, je vous conseille de le nommer sitemap.xml et de le placer à la racine de votre site Internet afin qu'il soit accessible via l'adresse http://www.monsite.fr/sitemap.xml.
  • vous utilisez un outil qui génère le fichier sitemap à la demande, dans ce cas, il vous suffit juste de noter dans un coin l'adresse qui permet de lancer la génération du sitemap.

Dernière étape, il faut enregistrer votre fichier sitemap auprès des différents moteurs de recherche.

Chez Google, vous pourrez déclarer votre sitemap via les Outils pour les Webmasters. Chez Yahoo, utilisez le Site Explorer. Enfin, chez Bing, c'est le Webmaster Center. Il vous faudra certainement créer un compte utilisateur pour accéder aux différents services, mais le principe reste le même : il faut juste indiquer à quelle adresse votre sitemap est stocké. Les robots d'indexation viendront alors régulièrement le scanner afin de voir si des modifications ont été apportées à votre site Internet.

Pour les moteurs de recherche qui ne proposent pas une interface pour soumettre votre fichier sitemap, il existe une petite astuce :

Modifiez (ou créez le si nécessaire) le fichier robots.txt présent à la racine de votre site. Ajouter la ligne ci-dessous :

Sitemap: http://www.example.org/sitemap.xml.

Ajouter un Commentaire

- Les commentaires sont modérés a posteriori.
- Tout commentaire à caractère injurieux, diffamatoire, xénophobe, raciste, antisémite, pornographique, révisionniste, homophobe, sexiste, d'incitation à la haine, à la violence ou en général tout sujet contraire à la loi et aux valeurs humanistes ne sont pas acceptés. Je me réserve le droit de supprimer sans avertissement tout commentaire dérogeant à cette règle.


Code de sécurité
Rafraîchir