SEO

Sitemap XML

También: sitemap, mapa del sitio, mapa del sitio XML

Un sitemap XML es un archivo que lista las URL de un sitio que quieres dar a conocer a los buscadores, para que los rastreadores descubran y prioricen tus páginas de cara a la indexación en lugar de depender solo de seguir los enlaces internos para encontrarlas.

Un sitemap le indica a un buscador qué páginas existen y, de forma opcional, cuándo se modificó cada una por última vez. Shopify genera uno automáticamente en /sitemap.xml, que a su vez apunta a sitemaps secundarios para productos, colecciones, páginas y entradas del blog. Enviar esa URL en Google Search Console le da a Google una lista directa y fiable para rastrear, lo que suele acelerar el descubrimiento de páginas nuevas y actualizadas, sobre todo en un catálogo grande o en una tienda nueva con pocos enlaces entrantes. La fecha de lastmod importa más de lo que muchos operadores creen: es la señal que lee un rastreador para decidir si vale la pena volver a descargar una página, así que una marca de tiempo precisa en una página que de verdad ha cambiado es una de las pocas palancas honestas que tienes sobre el momento del nuevo rastreo.

Conviene ser preciso sobre lo que un sitemap no hace. Listar una URL es una petición, no una orden: no garantiza que una página se indexe, no mejora el posicionamiento y no anula una etiqueta noindex ni un bloqueo en robots.txt. Una página puede figurar en un sitemap y aun así quedar excluida porque Google la considera pobre, duplicada o de poco valor. El sitemap es una ayuda para el descubrimiento, no un factor de posicionamiento, y tratarlo como lo segundo lleva a esfuerzo desperdiciado.

Piensa en una tienda Shopify que lanza cuarenta productos de temporada un jueves por la mañana. Como todavía no hay enlaces entrantes que apunten a esas URL, Google tiene que encontrarlas rastreando la navegación interna, lo que puede tardar días. Enviar el sitemap secundario de productos, con cada URL nueva llevando un valor de lastmod actual, le da al rastreador una lista plana que puede leer de una sola pasada, así que las páginas nuevas tienden a aparecer en los informes de cobertura mucho antes. Si más adelante esa misma tienda retira una línea descontinuada, esas URL deberían salir del sitemap en lugar de quedarse como errores 404 que erosionan en silencio la confianza en el archivo.

Mantén el sitemap honesto y seguirá siendo útil: debe contener solo URL canónicas, indexables y que devuelvan un estado 200. Los sitemaps con redirecciones, páginas muertas o duplicados por parámetros desperdician presupuesto de rastreo y diluyen la señal. Envíalo una vez en Search Console y luego trata los informes de cobertura e indexación de ahí como tu circuito de retroalimentación sobre si las páginas que listaste se están recogiendo de verdad.

El sitemap también importa para la búsqueda con IA y los motores de respuesta. Herramientas como ChatGPT, Perplexity y Google AI Overviews siguen dependiendo del índice web subyacente, o de sus propios rastreadores, para encontrar y leer tu contenido antes de poder citarlo. Una página que nunca se ha descubierto no se puede resumir ni citar en una respuesta. Un sitemap limpio y actualizado aumenta las probabilidades de que tus páginas de producto, colección y guía estén en el corpus del que tiran estos sistemas, que es la condición silenciosa para que alguna vez se las recuerde en una respuesta generada. No escribirá la respuesta por ti, pero asegura que tus páginas estén presentes cuando se componga la respuesta.