Sitemap et SEO : le duo gagnant ?

tuto-seo-sea-le-sitemap-seo

Dans la continuité des précédents dossiers consacrés au SEO, j’ai décidé de traiter un sujet de fond : le sitemap. Vous savez, ce petit fichier qui partage le web et suscite mine de rien beaucoup de questionnements autour de son rôle pour le SEO ? Je n’ai pas vocation à influencer les décideurs puisque je suis moi-même convaincu que ce fichier est plus ou moins exploité en fonction des retours d’expérience de chacun. Néanmoins, je pense que ce sujet ô combien mystérieux mérite d’être davantage décortiqué. Et quoi de mieux pour introduire ce billet que de vous citer un célèbre dicton : Aide Google et Google t’aidera.

Qu’est-ce qu’un sitemap ?

Le sitemap est un fichier au format XML ou Texte regroupant les URL internes d’un site web (jusqu »à 50 000) que l’on souhaite faire crawler par les moteurs de recherche. Pour faire simple, ce fichier est ni plus ni moins qu’un moyen d’indiquer aux robots de prendre en compte certaines URL. Ces robots respectent une logique d’indexation (protocole naturel) qu’il convient d’assimiler :

  1. Les robots vont commencer par lire le contenu de votre fichier robots.txt. Pour en savoir plus concernant ce fichier, rendez-vous dans ce dossier SEO
  2. Une fois qu’ils ont pris connaissance de vos instructions (via le robots.txt), ils vont télécharger le répertoire principal (la racine) de votre site web : www.digitude.fr par exemple
  3. Une fois le contenu de ce répertoire analysé, ils vont extraire l’ensemble des liens internes qui figurent sur cette page
  4. Chaque lien extrait va à son tour être exploré et téléchargé jusqu’à ce que les robots remarquent l’absence de « nouveaux liens » (qu’ils crawleront par la suite)

J’ai tendance à comparer la logique des robots avec une toile d’araignée. En effet, chaque niveau/étape a pour point de départ le centre, dans notre cas, le niveau 1 : la racine du site. En somme, si une url n’est pas accessible depuis une page indexée, il deviendra difficile pour les robots des moteurs de recherche de deviner leur existence.

Voilà pourquoi le sitemap est né : pour donner davantage d’indications aux robots dans le cas où ces derniers auraient du mal à repérer une URL. On peut dire que le sitemap est un moyen de devancer le protocole naturel d’indexation expliqué plus haut.

Parce que j’aime bien la pratique, voici un exemple concret d’un sitemap :

exemple_sitemap_digitude

Les nombreuses confusions à propos du sitemap

Attention à ne pas confondre le sitemap, fichier xml destiné aux moteurs de recherche avec le plan du site destiné quant à lui aux internautes.  Le plan du site est directement accessible depuis un site internet et permet d’expliquer aux internautes l’arborescence du site et les différentes pages qui s’y trouvent. Si le plan du site a très peu d’intérêt quand il est placé dans le footer d’un site, il n’en est pas moins efficace sur une page 404 par exemple.

Le robots.txt fait également partie des fichiers confondus avec le sitemap. Pour faire simple, le robots.txt est un fichier txt qui contient les URL que les robots ne doivent pas prendre en compte lors du crawl alors que le sitemap, c’est l’inverse : il contient les URL qu’ils doivent prendre en compte.

Les différents types de sitemap

Un site peut contenir différents types de contenu et avoir différents objectifs :

  1. Des pages classiques en HTML
  2. Des liens images
  3. Des liens vidéos
  4. Du contenu compatible mobile
  5. De l’actualité

Afin de bien discerner le type de contenu, chaque typologie possède son sitemap :

  1. Le schéma standard du sitemap indique les valeurs suivantes :
    1. L’URL de la page
    2. La date à laquelle l’URL a subit la dernière modification
    3. Une estimation de la fréquence à laquelle l’URL est modifiée
    4. Le degré d’importance de l’URL sur le site de manière générale
  2. Le schéma pour les sitemaps image indique les valeurs suivantes :
    1. L’URL de l’image
    2. La description du contenu de l’image
    3. Le titre donné à l’image
    4. Le lien vers la licence de l’image
    5. L’origine géographique de l’image
  3. Le schéma pour les sitemaps vidéo indique les valeurs suivantes :
    1. Le titre de la vidéo en question
    2. La description
    3. L’URL de la page qui contient la vidéo
    4. L’URL du thumbnail (de la vignette)
  4. Le schéma pour les sitemaps mobile indique les valeurs suivantes :
    1. L’URL de la page mobile
    2. La date à laquelle l’URL mobile a subit la dernière modification
    3. Une estimation de la fréquence à laquelle l’URL mobile est modifiée
    4. Le degré d’importance de l’URL mobile sur le site de manière générale
    5. La présence de la balise <mobile:mobile/> et </url> à la fin de l’écriture
  5. Le schéma pour les sitemaps actualité indique les valeurs suivantes :
    1. L’URL de l’actualité
    2. Le nom de la publication
    3. Le langage (FR, EN…)
    4. Le genre d’actualité
    5. La date de publication
    6. Le titre de publication
    7. Les mots clés liés à l’actualité
    8. Les stock tikers, fortement recommandé pour les articles financiers

La présence d’un sitemap est-elle obligatoire ?

Au même titre que la présence d’un robots.txt, d’un balisage Hn sensé ou encore de l’unicité des balises Title, la présence d’un sitemap est juste « recommandée ». On pourrait partir du principe que rien n’est obligatoire en matière de SEO et que, quitte à prioriser les tâches SEO, il vaut mieux travailler le contenu de vos pages plutôt que le sitemap…

La présence d’un sitemap est donc « utile » mais loin d’être obligatoire, surtout si vous possédez un site internet techniquement « simple », sur lequel vous publiez très peu de contenu.

Le travail que vous allez accomplir sur votre sitemap va donc dépendre de vos ressources techniques, du nombre de pages présentes sur votre site, de la fréquence de mise à jour de ce dernier et surtout, des technologies utilisées sur votre site (Js, Flash et compagnie). Si a minima votre site contient beaucoup de pages et est mis à jour régulièrement, je vous recommande fortement de créer un sitemap.

Quelle est l’utilité de proposer un sitemap aux robots ?

Rappelez-vous du dicton : Aide Google et Google t’aidera… Je crois que c’est déjà un bon début de réponse. Si les crawlers sont favorables au protocole Sitemaps, c’est qu’ils sont susceptibles de s’en servir à un moment donné. J’insiste sur le « susceptible » car rien ne garantit que les crawlers s’en servent véritablement : les crawlers sont les arbitres.

Néanmoins, je trouve ce fichier XML très utile pour plusieurs raisons :

  • Selon une ancienne étude commentée par le célèbre SEOMoz, soumettre un sitemap aux moteurs de recherche augmenterait la vitesse d’indexation de vos pages
  • Ça ne coûte rien de créer un sitemap, même si ce dernier est mal conçu ou pas du tout interprété par les crawlers. Dans tous les cas de figure, votre référencement ne sera pas pénalisé
  • On parle toujours de Google et oublions très souvent les autres moteurs de recherche. Si Google n’a pas obligatoirement besoin de votre sitemap XML pour détecter la présence de nouvelles URL, d’autres moteurs beaucoup moins puissants techniquement pourraient s’en servir. Je pense en particulier à Bing
  • Les relations entre votre sitemap et la Google Search Console vous permettent de suivre l’état d’indexation de votre sitemap (avec un historique s’il vous plaît !). En plus du monitoring, la console de Google vous permet de repérer facilement les erreurs liées à votre sitemap (erreurs que vous n’aurez pas forcément repéré du premier coup sur votre site !)
  • Si votre site ne possède que de l’actualité (et une ou deux pages statiques), il est possible de demander à Google d’indexer uniquement le sitemap news. Cela permet à Googlebot de se concentrer majoritairement sur le contenu faisant référence à l’actualité

Comment créer et soumettre un sitemap ?

La réponse va en partie dépendre de la manière dont a été conçu votre site internet. Si vous passez par un CMS type WordPress ou Prestashop, vous pouvez télécharger une extension qui générera pour vous, le fameux fichier sitemap en XML (je pense entre autre au plug-in Yoast pour WordPress). Si vous travaillez sur un site conçu sur-mesure ou bien passez par un CMS ne proposant pas de plug-in dédié à la génération de sitemap, vous devrez créer ce qu’on appelle un script. Dans tous les cas, l’objectif reste le même : faire en sorte que le sitemap se mette à jour automatiquement pour que vous n’ayez pas à le soumettre manuellement dans votre back-office…

Une autre solution existe mais autant vous dire que je ne l’apprécie guère : le générateur de sitemap. Vous n’aurez pas de mal à en trouver un peu partout sur la toile, le plus connu étant : XML Sitemap Generator. Le problème de ces générateurs, c’est qu’ils se contentent de produire un sitemap standard, type et pas forcément propre à votre activité. Certes, le process est simple et ne vous demande aucune connaissance technique mais encore faut-il faire en sorte que son contenu corresponde à votre site (fréquence des publications, type de support…). Attention également aux générateurs de type « crawlers » car certains d’entre eux ont tendance à venir surcharger les serveurs du site…

Comment soumettre un sitemap ?

Une fois que votre sitemap est prêt à l’emploi, vous devez indiquer à Google à quel endroit il peut venir le récupérer. Pour cela, rendez-vous dans votre compte Google Search Console. Dans le menu « Exploration », allez dans la rubrique « Sitemaps » et cliquez sur le bouton « Ajouter/Tester un sitemap » :

sitemaps_google_search_console_digitude

Ajoutez le nom de votre sitemap à la suite de votre nom de domaine, cliquez d’abord sur le bouton « Test » pour tester votre sitemap avant de l’envoyer. Une fois le test terminé par Google (cela peut lui prendre quelques minutes), prenez note de l’éventuelle présence d’erreur. Corrigez l’erreur s’il le faut, refaite un test pour voir si l’erreur persiste et envoyez votre sitemap :

tester_sitemap_google_search_console_digitude

Eh voilà, il ne vous reste plus qu’à surveiller l’état d’indexation de vos urls. Gardez en tête que le nombre d’URL s’affichant dans la colonne « URL envoyées » doit se rapprocher le plus possible du nombre s’affichant dans la colonne « Dans l’index ». A vous de jouer !

Alors ? Sitemap & SEO : duo gagnant ou pas ?

L’absence ou la présence d’un sitemap n’impacte ni positivement, ni négativement le SEO d’un site. Mais ne vous êtes-vous jamais demandé pourquoi le protocole sitemaps avait été accepté et validé par les crawlers il y a de ça 10 belles années ? Je pars du principe que rien n’est fait au hasard, surtout quand on parle de Google donc dire que le sitemap n’a pas d’intérêt est une erreur de débutant. Maintenant, dire qu’avec le SEO, il forme le duo gagnant, oui et non.

Le SEO inclut deux notions fondamentales à ne pas confondre : le référencement et le positionnement (voir article : qu’est-ce que le SEO ?). Pour le positionnement, le sitemap ne joue clairement aucun rôle. C’est pas parce que votre page est indexée sur Google qu’elle est bien positionnée. Et c’est pas parce que vous soumettrez un sitemap aux moteurs de recherche que ces derniers amélioreront le positionnement de votre page. Par contre, concernant l’indexation (et donc le référencement), on peut dire que les informations contenus dans le sitemap viennent « réduire » et soulager la mission des crawlers. Rendre facile la tâche aux robots peut dans certains cas (pas tous) accélérer le processus d’indexation de vos nouvelles pages. Donc duo gagnant pour le référencement, oui mais uniquement en terme de temps (si les crawlers le veuillent bien).

Sitemap et SEO : le duo gagnant ?
5 (100%) 8 votes

LAISSER UN COMMENTAIRE

Please enter your comment!
Please enter your name here