SEO

XML-Sitemap

Auch: Sitemap, XML Sitemap, sitemap.xml

Eine XML-Sitemap ist eine Datei, die alle URLs eines Shops auflistet, die Suchmaschinen kennen sollen, damit Crawler die Seiten finden und für die Indexierung priorisieren können, statt sich allein auf interne Verlinkung zu verlassen, um sie überhaupt zu entdecken.

Eine Sitemap sagt einer Suchmaschine, welche Seiten existieren und optional, wann jede zuletzt geändert wurde. Shopify erzeugt automatisch eine Sitemap unter /sitemap.xml, die wiederum auf untergeordnete Sitemaps für Produkte, Kollektionen, Seiten und Blogbeiträge verweist. Reichst du diese URL in der Google Search Console ein, bekommt Google eine direkte, verlässliche Liste zum Crawlen, was die Entdeckung neuer und aktualisierter Seiten in der Regel beschleunigt, besonders bei einem großen Sortiment oder einem neuen Shop mit wenigen eingehenden Links. Das lastmod-Datum wiegt schwerer, als viele Betreiber annehmen: Es ist das Signal, das ein Crawler liest, um zu entscheiden, ob eine Seite ein erneutes Abrufen wert ist. Ein korrekter Zeitstempel auf einer tatsächlich geänderten Seite ist also einer der wenigen ehrlichen Hebel, die du über das Recrawl-Timing hast.

Es lohnt sich, genau zu sein, was eine Sitemap nicht leistet. Eine URL aufzulisten ist eine Bitte, kein Befehl: Es garantiert nicht, dass eine Seite indexiert wird, es hebt keine Rankings, und es überstimmt weder ein noindex-Tag noch eine Sperre in der robots.txt. Eine Seite kann in einer Sitemap stehen und trotzdem ausgeschlossen bleiben, weil Google sie als dünn, doppelt oder geringwertig einstuft. Die Sitemap ist eine Hilfe zur Entdeckung, kein Ranking-Faktor, und sie als Letzteres zu behandeln führt zu vergeudeter Mühe.

Nimm einen Shopify-Shop, der an einem Donnerstagmorgen vierzig neue Saisonprodukte einstellt. Solange noch keine eingehenden Links auf diese URLs zeigen, muss Google sie über das Crawlen der internen Navigation finden, was Tage dauern kann. Reichst du die Produkt-Sitemap ein, bei der jede neue URL einen aktuellen lastmod-Wert trägt, bekommt der Crawler eine flache Liste, die er in einem Durchgang liest, sodass die neuen Seiten in den Abdeckungsberichten meist deutlich früher auftauchen. Nimmt derselbe Shop später eine ausgelaufene Linie aus dem Sortiment, sollten diese URLs aus der Sitemap verschwinden, statt als 404-Seiten zu verbleiben, die das Vertrauen in die Datei still untergraben.

Halte die Sitemap ehrlich, dann bleibt sie nützlich: Sie sollte nur kanonische, indexierbare URLs enthalten, die einen 200-Status zurückgeben. Sitemaps mit Weiterleitungen, toten Seiten oder Parameter-Duplikaten verschwenden Crawl-Budget und verwässern das Signal. Reiche sie einmal in der Search Console ein und nutze danach die Abdeckungs- und Indexierungsberichte dort als Rückkopplung, ob die aufgelisteten Seiten tatsächlich aufgenommen werden.

Die Sitemap zählt auch für die KI-Suche und Antwortmaschinen. Werkzeuge wie ChatGPT, Perplexity und Google AI Overviews hängen weiterhin vom zugrunde liegenden Web-Index ab oder von ihren eigenen Crawlern, um deine Inhalte zu finden und zu lesen, bevor sie sie zitieren können. Eine Seite, die nie entdeckt wurde, lässt sich weder zusammenfassen noch in einer Antwort zitieren. Eine saubere, aktuelle Sitemap erhöht die Chance, dass deine Produkt-, Kollektions- und Ratgeberseiten im Korpus liegen, aus dem diese Systeme schöpfen, und das ist die stille Voraussetzung dafür, in einer generierten Antwort überhaupt erwähnt zu werden. Sie schreibt die Antwort nicht für dich, aber sie sorgt dafür, dass deine Seiten im Raum sind, wenn die Antwort entsteht.