Trucs et astuces : le guide ultime pour les sitemaps XML

Kevin Indig

avr. 03, 20209 min de lecture
Trucs et astuces : le guide ultime pour les sitemaps XML

TABLE DES MATIÈRES

Durant mes premières semaines à Atlassian, j’ai cherché une solution rapide pour renforcer ma position dans l’entreprise et prêcher la bonne bonne parole du SEO. J’ai donc effectué un audit de notre site principal et j’ai remarqué qu’il n’avait pas de sitemap XML. C’était un angle d’attaque facile !

Je suis allé voir les développeurs et je leur ai demandé de l’activer dans le CMS. À ma grande surprise, ils m’ont répondu que ce n’était pas possible, et ça m’a beaucoup étonné.

Après réflexion, je me suis rappelé que Screaming Frog avait une fonction sitemap XML. J’ai donc écumé le site et chargé l’exploration en tant que sitemap XML.

Google l’a assimilé en quelques secondes, et nous avons observé un impact visible sur notre trafic les jours suivants.

La morale de l’histoire, c’est que les sitemaps XML sont importants et parfois sous-estimés.

Qu’est-ce qu’un sitemap XML et pourquoi est-il nécessaire ?

Les sitemaps XML sont des cartes numériques qui aident Google à découvrir les pages importantes de votre site et leur fréquence de mises à jour.

Google écrit sur la page de son centre d’aide :

Un sitemap indique à Google les fichiers que vous jugez importants sur votre site et fournit également des informations précieuses sur ces fichiers. Par exemple, il permet d’indiquer la date de dernière mise à jour d’une page, sa fréquence de modification et les versions qui existent dans d’autres langues.

Selon Gary Illyes, les sitemaps XML sont la deuxième source la plus importante d’URL à explorer par Googlebot après les hyperliens et les URL antérieurement découvertes. C’est extrêmement important et ne doit pas être sous-estimé !

les sitemaps XML sont la deuxième source la plus importante d’URL à explorer par Googlebotles sitemaps XML sont la deuxième source la plus importante d’URL à explorer par Googlebot

Les sitemaps sont la deuxième option Découverte la plus pertinente pour Googlebot @methode #SOB2019

Tout site web devrait avoir un sitemap XML. Ils sont particulièrement importants pour :

  • les gros sites
  • les nouveaux sites
  • les sites avec beaucoup de pages orphelines
  • les sites utilisant beaucoup d’images et de vidéos

Le fichier robots.txt vous aide à empêcher que des parties de votre site soient positionnées dans les moteurs de recherche, tandis que les sitemaps XML font le contraire. Ils aident les moteurs de recherche à découvrir de nouvelles pages, même si elles ne reçoivent pas de liens du site principal.

Google a commencé à utiliser les sitemaps XML en 2005, et il a été rejoint peu après par des moteurs de recherche comme MSN ou Yahoo. Aujourd’hui, son utilisation dépasse de beaucoup la simple découverte d’URL.

Ne les confondez pas avec les sitemaps HTML. Les sitemaps XML ne sont pas visibles pour les visiteurs, ils le sont seulement pour Google et les spécialistes SEO qui veulent connaître les pages importantes des concurrents (clin d’œil complice). Les sitemaps HTML sont des listes (parfois belles) de liens internes qui font passer le PageRank de la homepage aux pages importantes, ils servent de pôles d’exploration, et rendent la navigation plus facile aux utilisateurs. Et évidemment, vous devez avoir les deux.

Le format XML des sitemaps permet à Google d’effectuer une analyse rapide pour trouver de nouvelles URL. Le XML — eXtensible Markup Language (« langage de balisage extensible ») — est léger et transférable d’un appareil à l’autre, et il a été conçu pour stocker des données.

La façon la plus simple pour vous de vérifier si votre site a un sitemap consiste à regarder dans « sitemaps » dans Google Search Console ou dans Bing Webmaster Tools. La plupart des moteurs de recherche, comme Google ou Bing, cherche l’entrée (ou les entrées) « Sitemap : <sitemap_location> » dans le fichier robots.txt de votre site. Sinon, vous pouvez envoyer une requête ping pour demander l’exploration de votre sitemap à GoogleBaiduBing, et Yandex.

Les sitemaps XML dans Bing Webmaster Tools
Les sitemaps XML dans Bing Webmaster Tools. 1 : Rapport sitemaps. 2 : Ajouter de nouveaux chemins sitemap. 3 : sitemaps Bing existants trouvés.

Les sitemaps XML dans Google Search Console.Les sitemaps XML dans Google Search Console. 1 : Rapport sitemaps. 2 : Ajouter de nouveaux chemins sitemap. 3 : sitemaps Google existants trouvés.

Exigences minimales pour les sitemaps XML

Pour que vos sitemaps XML fonctionnent de façon optimale, vous devez respecter les normes. Un sitemap XML doit :

  • Contenir uniquement des URL canoniques avec un status code 200.
  • Inclure jusqu’à 200K URL par sitemap et jusqu’à 50K sitemaps par index sitemap.
  • Être référencé dans le robots.txt.
  • Avoir un codage BUTF-8.
  • Être compressé dans le format .gz.
  • Ne pas dépasser 50mb ou contenir plus de 50 000 URL (la première limite atteinte).

Mais vous pouvez (et devez) faire plus pour tirer le maximum de vos sitemaps XML. Vous pouvez signaler à Google quelles URL comptent le plus en incluant seulement les pages importantes dans les sitemaps XML, et en les mettant souvent à jour.

La plupart des CMS ont une fonction pour mettre à jour automatiquement les sitemaps quand une nouvelle URL est créée ou qu’une page existante change. Pour Google, la fréquence des mises à jour du sitemap et de la balise lastmod des pages peut être un signal de fraîcheur. L’importance qu’il y donne pour le classement dépend de la page et du contexte.

Considérez un sitemap XML comme la carte touristique d’une ville, la ville étant votre site, et les touristes Google : vous voulez être sûr d’inclure uniquement les bâtiments importants, pas toutes les adresses. C’est pour cela qu’il vaut mieux que les pages non importantes ne soient pas incluses ; par exemple, la page concernant votre politique de confidentialité, mais aussi « à propos de nous ». Ces pages doivent être indexées, mais elles n’ont pas à être explorées souvent et ne sont pas importantes du point de vue du SEO.

Conseils pour la sitemap XML des gros sites

Vous pouvez faire encore davantage pour améliorer votre sitemap, et aller au-delà des exigences standards.

Les gros sites, comme les sites d’informations, devraient utiliser les sitemaps index, qui contiennent des sitemaps normaux (jusqu’à 50 000), et ne doivent pas dépasser 50mb. Ils sont comme le navire-mère, qui transporte de nombreux sitemaps plus petits. Les gros sites en ont besoin, car ils ne tiennent pas dans un seul sitemap. Et de toute façon, n’essayez pas de tout mettre dans un seul sitemap.

Vous pouvez tirer le maximum de ces sitemaps en les structurant soit par type de page, soit par sujet. En pratique, vous créez des sitemaps XML dédiés par sous-dossier ou modèle de page pour comprendre les problèmes techniques ou d’indexation liés à votre site.

Vous pouvez tirer le maximum de ces sitemaps en les structurant soit par type de page, soit par sujet.
Vous pouvez tirer le maximum de ces sitemaps en les structurant soit par type de page, soit par sujet.

Il existe des sitemaps XML spécialisés pour répondre à des objectifs spécifiques. Pour les sites qui dépendent énormément du rich media (comme Pinterest ou YouTube), les sitemaps image ou video sont très utiles. Les éditeurs doivent avoir des sitemaps news.

Les sitemaps image augmentent la probabilité que votre site soit trouvé dans Google Images. Il n’est pas nécessaire d’avoir un sitemap image dédié, vous pouvez aussi utiliser les extensions image dans votre sitemap normal.

Voici à quoi ressemblent les extensions image (spécifications XML) :

extensions image (spécifications XML) 
Les sitemaps video obéissent au même principe : créez un sitemap dédié ou ajouter des extensions à votre sitemap normal.
sitemap video

Mais faites attention aux méta-données que vous ajoutez aux sitemaps ou extensions video.

Google précise qu’il « peut utiliser le texte sur la page de destination de la vidéo plutôt que le texte que vous fournissez dans votre sitemap, si le texte de la page est jugé plus utile que les informations dans le sitemap. » Il veut parler du texte délivré dans la description. Et en plus de la description, vous pouvez donner à Google une vignette, la longueur de la vidéo, son évaluation, son niveau d’adaptation aux familles, et plus (liste complète des méta-données pour le sitemap XML video). Pour les sites utilisant beaucoup les vidéos, cette solution est pertinente. Pour les autres, elle est facultative.

Les sitemaps news sont différents, dans la mesure où vous devez toujours avoir un sitemap XML news séparé. Google ne recommande pas d’extensions dans ce cas (ni n’en propose). Les sitemaps news aident Google à découvrir et à positionner les nouveaux articles, ce qui constitue un véritable défi dans le secteur de l’édition, où l’on produit habituellement beaucoup de contenu. Même si Google affirme que les éditeurs avec des sitemaps news ne sont pas favorisés, cela aide quand même les actualités brûlantes à être classées plus rapidement dans Google News.

Les sitemaps news ont des exigences spéciales 

  • Incluez des articles de moins de 2 jours.
  • N’ajoutez pas plus de 1000 nouvelles entrées en même temps à un sitemap existant.
  • Mettez à jour les sitemaps existants pour les mises à jour d’articles.

Vous pouvez également utiliser les sitemaps XML pour définir et indiquer certaines balises meta à Google. Hreflang, par exemple ; vous pouvez l’ajouter en tant qu’extension à un sitemap (directives complètes) :

sitemaps news

Google ignore l’attribut <priority> dans les sitemaps XML, mais tient compte de lastmod, selon John Mueller. Google détermine la priorité de vos pages par lui-même, en se fondant probablement sur la popularité et l’autorité. Lastmod, cependant, est une balise qui indique quand l’URL a changé pour la dernière fois, ce qui est très intéressant pour Google.

Lastmod, cependant, est une balise qui indique quand l’URL a changé pour la dernière fois, ce qui est très intéressant pour Google.
- Inutile de structurer vos fichiers sitemap files avec priority. @JohnMu Qu’en est-il pour frequency et lastmod ? - L’ URL + dernière date de modification est ce qui importe pour la recherche sur le web.

Par ailleurs, vous n’avez pas besoin d’ajouter de sitemaps XML pour les URL AMP, selon John Mueller.

- Les sitemaps sont nécessaires pour les pages AMP avec version canonique ? Est-ce que link=rel entre les deux est suffisant pour être indexé ? - Pas besoin de sitemaps pour les pages AMP – le lien rel=amphtml nous suffit.
Pas besoin de sitemaps pour les pages AMP – le lien rel=amphtml nous suffit.

Outils et générateurs de sitemaps XML

La plupart des systèmes de gestion de contenu sont accompagnés de fonctions préemballées qui vous permettent de créer automatiquement un sitemap XML. Mais certains ne le sont pas, et dans ce cas vous avez besoin d’un outil tiers.

Meilleurs générateurs de sitemaps

Voici ma sélection personnelle pour les générateurs de sitemaps XML.

Nom

Prix

Limite

Fonctionnalités

Essai gratuit

Slickplan

8,99$/mois

n/a

  • Générateur Glisser-déposer
  • Inclusion de type de page personnalisé
  • Import fichier texte
  • Cloning
  • Édition par lots
  • Hyper-personnalisable
  • Permissions utilisateur
  • Personnalisation avec marque

30 jours

Dynomapper

40$/mois

200K URL par exploration

  • Surveillance des URL dans sitemaps dans Google Analytics
  • Hyper-personnalisable
  • Inclusion de type de page personnalisé
  • Gestion du flux de travail
  • Balisage des URL
  • Filtrage sitemap
  • Permissions utilisateur
  • Personnalisation avec marque

14 jours

Writemaps

14,99$/mois

n/a

  • Personnalisable
  • Groupes personnalisés
  • Générateur Glisser-déposer

3 sitemaps gratuits

Screaming Frog

Gratuit jusqu’à 500 URL

149£/an

n/a

  • Pas fait pour les sitemaps XML mais bien conçu pour les restrictions technniques

n/a

Powermapper

$49$/mois

15K pages

  • Pas fait pour les sitemaps XML mais peut exporter un flux en format XML

30 jours

XML Sitemaps

4,99$ pour 1K pages

189,99$ pour 1,5 million de pages

1,5 million de pages

  • Sitemaps image et video
  •  Notifications par e-mail
  • Appli mobile
  • Détecte les liens cassés

Gratuit pour 500 pages

Meilleurs plugins Wordpress pour les sitemaps

Nom

Prix

Limite

fonctionnalités

Evaluation

Simple Wp Sitemap

gratuit

n/a

  • sitemap HTML et XML
  • Sitemaps dynamiques

4.4/5

33 avis

Google Sitemap by BestWebSoft

gratuit

n/a

  • Support hreflang
  • Personnalisable

4.3/5

112

Google XML Sitemaps

gratuit

n/a

  • Sitemaps dynamiques
  • Personnalisable

4.9/5

2090 avis

Yoast SEO

gratuit (premium disponible)

n/a

  • Sitemap basique, dynamique

4.9/5

26,745 avis

WordPress XML Sitemap Plugin

gratuit

n/a

  • Hyper-personnalisable

n/a

All in One SEO Pack

gratuit

n/a

  • Sitemap basique, dynamique

4.4/5

449 avis

XML Sitemap & Google News

gratuit

n/a

  • Sitemap basique, dynamique
  • Personnalisable
  • Mises à jour lastmod automatiques

4.4/5

59 avis

Avez-vous des conseils ou des outils pour les sitemaps XML ? Parlez-nous-en dans les commentaires !

Partager