Sitemap XML
Un sitemap XML est un fichier qui liste les URL d'un site que vous souhaitez soumettre aux moteurs de recherche, afin que les robots d'exploration puissent découvrir et prioriser les pages à indexer sans dépendre uniquement de la navigation interne.
Un sitemap XML indique à un moteur de recherche quelles pages existent et, optionnellement, quand chacune a été modifiée pour la dernière fois. Shopify en génère un automatiquement à l'adresse /sitemap.xml, qui renvoie à son tour vers des sitemaps enfants pour les produits, les collections, les pages et les articles de blog. Soumettre cette URL dans Google Search Console donne à Google une liste directe et fiable à explorer, ce qui accélère généralement la découverte des pages nouvelles et mises à jour, en particulier pour un catalogue volumineux ou une boutique récente avec peu de liens entrants. La date lastmod compte plus que la plupart des marchands ne le réalisent : c'est le signal qu'un robot de crawl lit pour décider si une page mérite d'être recrawlée, et un horodatage exact sur une page réellement modifiée est l'un des rares leviers honnêtes dont vous disposez sur la fréquence de recrawl.
Il est utile d'être précis sur ce qu'un sitemap ne fait pas. Lister une URL est une demande, non un ordre : cela ne garantit pas qu'une page sera indexée, ne relève pas le classement et ne supplante pas une balise noindex ou un bloc robots.txt. Une page peut figurer dans un sitemap et être exclue si Google la juge pauvre en contenu, dupliquée ou peu pertinente. Le sitemap est un outil de découverte, non un signal de classement, et le considérer comme tel conduit à des efforts inutiles.
Imaginez une boutique de maroquinerie qui met en ligne quarante nouveaux articles de saison un jeudi matin. Sans liens entrants pointant vers ces URL, Google doit les trouver en explorant la navigation interne, ce qui peut prendre plusieurs jours. Soumettre le sitemap enfant des produits, avec chaque nouvelle URL portant une valeur lastmod à jour, donne au robot une liste plate qu'il peut lire en un seul passage, et les nouvelles pages tendent à apparaître bien plus tôt dans les rapports de couverture de Search Console. Si la même boutique retire une référence discontinuée, ces URL doivent disparaître du sitemap plutôt que de subsister comme des pages 404 qui érodent silencieusement la crédibilité du fichier.
Maintenez le sitemap fiable et il reste utile : il doit contenir uniquement des URL canoniques et indexables qui retournent un statut 200. Les sitemaps contenant des redirections, des pages mortes ou des doublons de paramètres gaspillent le budget de crawl et affaiblissent le signal. Soumettez-le une fois dans Search Console, puis traitez les rapports de couverture et d'indexation comme votre boucle de rétroaction sur les pages réellement prises en compte.
Le sitemap compte aussi pour la recherche IA et les moteurs de réponse. Des outils comme ChatGPT, Perplexity et Google AI Overviews dépendent toujours de l'index web sous-jacent, ou de leurs propres robots, pour trouver et lire votre contenu avant de pouvoir le citer. Une page qui n'a jamais été découverte ne peut pas être résumée ni citée dans une réponse générée. Un sitemap propre et à jour augmente les chances que vos pages produit, collection et guide fassent partie du corpus sur lequel ces systèmes s'appuient, condition préalable pour être rappelé dans une réponse. Il n'écrira pas la réponse à votre place, mais il s'assure que vos pages sont présentes quand la réponse est composée.