Semantische Suche (Semantic Search)
Die semantische Suche liefert Ergebnisse nach Bedeutung statt nach exakter Keyword-Übereinstimmung, indem sie die Suchanfrage und die infrage kommenden Dokumente in Embeddings (numerische Vektoren) umwandelt und danach sortiert, wie nah diese Vektoren im Raum beieinanderliegen, sodass eine Seite zu einer Frage passen kann, obwohl sie kein einziges Wort mit ihr teilt.
Die klassische Keyword-Suche hat Wortüberschneidungen gezählt: Eine Seite rankte, weil sie die gesuchten Wörter wiederholte. Die semantische Suche misst stattdessen die inhaltliche Ähnlichkeit, sodass eine Anfrage wie "Schuhe, die Trailrunning aushalten" ein Produkt finden kann, das als "robuste Offroad-Sneaker" beschrieben ist, ganz ohne gemeinsame Wörter. Möglich wird das, weil sowohl die Anfrage als auch das Dokument in Embeddings umgewandelt werden, also in Vektoren, die Bedeutung kodieren, und das System nach dem Abstand zwischen ihnen sortiert. Deshalb hat Keyword-Stuffing seine Wirkung verloren: Eine Seite mit wiederholten Phrasen vollzustopfen bewegt den Vektor kaum, während klares, präzises Schreiben, das den Inhalt schlicht benennt, tendenziell näher an die Anfragen rückt, auf die es ankommt.
Die praktische Lehre ist, so zu schreiben, wie ein Kunde tatsächlich fragen würde, und das Thema in direkter Sprache weit oben im Text zu benennen, statt es zu verstecken. Konkretheit hilft dem Embedding, echte Bedeutung zu tragen: "wasserdicht bis 50 Meter" liegt näher an der Frage eines Schwimmers als "gut für Wasser", weil es ein konkretes Merkmal nennt, das das Modell verorten kann. Vage, werbliche Formulierungen driften eher zur Mitte des Raums, nah an allem und nah an nichts.
Nimm einen Shopify-Shop, der gusseisernes Kochgeschirr verkauft. Ein Kunde fragt einen Assistenten: "Welche Pfanne kann ich direkt vom Herd in den Ofen stellen, ohne dass sie sich verzieht?" Die Produktseite verwendet diese Worte nie. Sie sagt aber: "vollständig eingebrannte Pfanne, ofenfest bis 260 Grad, einteilige Bauweise ohne Plastikgriff". Unter der Keyword-Suche könnten sich diese Formulierungen komplett verfehlen. Unter der semantischen Suche liegen sie nah beieinander, weil ofenfest, einteilig und ohne Plastikgriff zusammen den Begriff kodieren, vom Herd sicher in den Ofen zu wechseln. Der Shop gewinnt die Übereinstimmung, indem er das Merkmal ehrlich beschreibt, nicht indem er die genaue Anfrage errät. Dieselbe Logik gilt für Bewertungen: Ein Kunde, der schreibt "ich hatte sie eine Stunde bei 220 Grad im Ofen, und sie hat ihre Form gehalten", verstärkt den Begriff in einer Sprache, die kein Marketer so verfassen würde, was mit ein Grund ist, warum echter Bewertungstext nützliches Rohmaterial für die Suche ist.
Die semantische Suche steckt auch hinter den meisten KI-Antworten. Wenn ChatGPT, Perplexity oder Google AI Overviews vor dem Antworten Quellen zusammentragen, finden sie diese in der Regel über Embedding-Ähnlichkeit statt über wörtliche Keywords und fassen dann zusammen, was sie finden. Texte, die Merkmale klar benennen, lassen sich für diese Systeme daher leichter finden und zitieren. Ein wichtiger Vorbehalt: Ähnlichkeit ist nicht Korrektheit. Eine Seite kann gefunden werden, weil sie thematisch nah ist, und trotzdem falsch sein. Das ist einer der Gründe, warum Antwortmaschinen sich auf die Übereinstimmung mehrerer unabhängiger Quellen stützen, und warum konsistente, sachliche Produktbeschreibungen tendenziell häufiger zitiert werden als gewitzte.
