SEO

Sitemap XML

Também: sitemap, sitemap XML, mapa do site

Um sitemap XML é um arquivo que lista as URLs de um site que você quer que os mecanismos de busca conheçam, permitindo que os crawlers descubram e priorizem páginas para indexação em vez de depender apenas dos links internos para encontrá-las.

Um sitemap informa ao mecanismo de busca quais páginas existem e, opcionalmente, quando cada uma foi alterada pela última vez. O Shopify gera um automaticamente em /sitemap.xml, que por sua vez aponta para sitemaps filhos de produtos, coleções, páginas e posts do blog. Enviar essa URL no Google Search Console dá ao Google uma lista direta e confiável para rastrear, o que normalmente acelera a descoberta de páginas novas e atualizadas, especialmente em um catálogo grande ou em uma loja recente com poucos links externos. A data lastmod importa mais do que a maioria dos lojistas percebe: é o sinal que o crawler lê para decidir se vale a pena refazer o rastreamento de uma página, então um timestamp preciso em uma página que realmente mudou é um dos poucos meios concretos de influenciar o momento em que ela será reavaliada.

Vale ser preciso sobre o que um sitemap não faz. Listar uma URL é um pedido, não uma ordem: não garante que a página seja indexada, não melhora posições e não substitui uma tag noindex ou um bloqueio no robots.txt. Uma página pode estar no sitemap e ainda assim ser excluída porque o Google a considera rasa, duplicada ou de baixo valor. O sitemap é um recurso de descoberta, não um fator de ranqueamento, e tratá-lo como tal gera esforço desperdiçado.

Considere uma loja Shopify que lança quarenta produtos de uma coleção nova em uma quinta-feira de manhã. Sem links externos apontando para essas URLs ainda, o Google precisa encontrá-las rastreando a navegação interna, o que pode levar dias. Enviar o sitemap filho de produtos, com cada nova URL carregando um valor lastmod atual, dá ao crawler uma lista direta que ele pode ler em uma única passagem, então as novas páginas tendem a aparecer nos relatórios de cobertura bem mais cedo. Se a mesma loja remover depois uma linha descontinuada, essas URLs devem sair do sitemap em vez de ficar como erros 404 que silenciosamente prejudicam a credibilidade do arquivo.

Mantenha o sitemap honesto e ele permanece útil: deve conter apenas URLs canônicas e indexáveis que retornem status 200. Sitemaps com redirecionamentos, páginas mortas ou duplicatas com parâmetros desperdiçam o orçamento de rastreamento e enfraquecem o sinal. Envie uma vez no Search Console e use os relatórios de cobertura e indexação como retorno sobre o que está sendo descoberto de fato.

O sitemap também importa para a busca por IA e motores de resposta. Ferramentas como ChatGPT, Perplexity e Google AI Overviews ainda dependem do índice da web, ou de seus próprios crawlers, para encontrar e ler o seu conteúdo antes de citá-lo. Uma página que nunca foi descoberta não pode ser resumida nem mencionada em uma resposta. Um sitemap limpo e atualizado aumenta as chances de que suas páginas de produto, coleção e guias estejam no corpus que esses sistemas usam, o que é a condição necessária para ser lembrado em uma resposta gerada. Não vai escrever a resposta por você, mas garante que suas páginas estejam na sala quando a resposta for composta.