lundi 28 octobre 2013

Le fichier Sitemap

Fichier Sitemap
Comme le fichier robots.txt, le fichier Sitemap n'est pas obligatoire. Le fichier Sitemap indique aux robots des moteurs de recherche (Google, Bing, Yahoo !, Exalead et Orange) toutes les URLs qu'ils doivent connaître pour être crawlées.

Au sujet du fichier Sitemap

Avant toute chose, il faut savoir que Sitemap n'est pas que le nom d'un fichier. Sitemap est également le nom d'un protocole mis au point par Google en 2005.

Après avoir crawlé les pages listées, si le fichier Sitemap ne comporte pas d'erreur, les URL du fichier Sitemap devraient être indexées. En effet, ce fichier accélère l'indexation mais pas le positionnement.

Création du fichier Sitemap

Pour créer un fichier Sitemap, vous devez créer un fichier XML avec la liste des URL des pages et des informations telles que la fréquence de mise à jour ou la priorité d'indexation.

Règles à suivre pour créer le fichier Sitemap

 

Pour que les robots des moteurs de recherche lisent votre fichier, le prennent en compte et indexent mieux les pages de votre site, il ne faut pas oublier que :
  • Le moteur de recherche fait la loi. S'il ne souhaite pas indexer des pages, il ne le fera pas. Il facilite l'indexation mais ne la garantie pas.

  • Le fichier Sitemap ne devra pas contenir plus de 50 000 URL. Toutefois, vous pouvez créer plusieurs fichiers. Vous devez alors les placer dans un fichier d'index des sitemaps pour mettre au point un répertoire de vos sitemaps.

  • Codez l'URL du fichier Sitemap en UTF-8 pour une meilleure lisibilité de la part du serveur où il est situé.

Les balises du fichier Sitemap

Le fichier Sitemap est un fichier XML qui procure des informations, sur chaque page du site, comme :
  • La balise <urlset> (obligatoire) se trouve au début et à la fin (</urlset>) du fichier Sitemap.

  • La balise <url> (obligatoire) possède les informations d'une URL précise.

  • La balise <loc> (obligatoire) indique l'adresse de la page web. L'URL commencera par http:// et finira accessoirement par /.

  • La balise <lastmod> (facultative) indique la dernière modification de l'URL de la page. Elle doit être au format ISO 8601 de la manière suivante : AAAA-MM-JJ. Ainsi, le 28 octobre 2013 est écrit 2013-10-28.

  • La balise <changefreq> (facultative) précise la fréquence de mise à jour de la page. Il existe plusieurs valeurs : always, hourly, daily, weekly, monthly, yearly et never.

  • La balise <priority> (facultative) précise quelle importance vous donnez à la page par rapport aux autres pages de votre site. Elle a un niveau de priorité compris entre 0 et 1. Elle peut être de 0.6. Faites attention à utiliser un point et non une virgule pour indiquer la décimale. La valeur par défaut est de 0.5.

Créer ou ne pas créer un fichier Sitemap ?

Un fichier Sitemap est plus utile pour un gros site qu'un petit site. Après, ce n'est pas obligatoire...

Vous pouvez créer un fichier Sitemap pour des contenus spécifiques tels que des images, des vidéos, des actualités et des contenus adaptés aux mobiles. Le format XML est alors obligatoire (dans les autres cas, il peut être au format TXT).

Conseils à propos du fichier Sitemap

Si vous en créez un, donnez lui un nom qui ne permette pas de comprendre qu'il s'agit du fichier Sitemap. La concurrence irait voir ce qu'il contient pour vous piquer ce que votre site possède.

Ainsi, dans votre fichier robots.txt, ne nommez pas votre fichier Sitemap :
Sitemap: http://www.example.fr/sitemap.xml

Mais plutôt que d'utiliser le fichier robots.txt, déclarez votre fichier Sitemap avec Google Webmaster Tools et Bing Webmaster Tools.

Aucun commentaire: