Wyszukiwanie AI

Grounding

Inaczej: ugruntowanie modelu AI, grounding AI

Grounding to praktyka łączenia odpowiedzi modelu AI z weryfikowalnymi materiałami źródłowymi, dzięki której model odpowiada na podstawie dokumentów pobranych w czasie zapytania, a nie z własnej pamięci, co sprawia, że każde twierdzenie można powiązać z konkretną stroną, na której model się oparł.

Kiedy model jest ugruntowany, odpowiada na podstawie tekstu pobranego w czasie zapytania, a nie generuje odpowiedzi wyłącznie ze swoich parametrów. To właśnie ten krok pobierania danych tworzy linkowane cytowania widoczne w silnikach odpowiedzi AI: każde twierdzenie można prześledzić do fragmentu tekstu, a ten fragment wskazuje na stronę. Nieugruntowana odpowiedź nie ma żadnego źródła do zacytowania, dlatego brzmi płynnie, ale nie można jej zweryfikować. To rozróżnienie ma znaczenie, bo oba typy błędów są inne. Nieugruntowany model, który się myli, nie ma żadnego sposobu, żeby o tym wiedzieć; ugruntowany model, który się myli, ma przynajmniej dokument, który można sprawdzić, i ścieżkę, po której można wrócić do źródła.

Grounding wyjaśnia też, dlaczego bycie przejrzystym, czytelnym źródłem to sposób na uwzględnienie w odpowiedzi AI. Model ugruntowuje się na stronach, które potrafi przetworzyć i którym ufa: napisanych prostym językiem, wewnętrznie spójnych i potwierdzonych w innych miejscach. Twierdzenie pojawiające się raz na jednej mało znanej stronie to słaby materiał do ugruntowania; to samo twierdzenie sformułowane wyraźnie i powtórzone w niezależnych źródłach to materiał mocny. Silnik wyszukiwania musi znaleźć fragment, model musi go zrozumieć, a system musi uznać go za wystarczająco wiarygodny, żeby go zacytować. Każdy z tych kroków nagradza przejrzystą strukturę bardziej niż błyskotliwe sformułowania.

Wyobraź sobie sprzedawcę Shopify sprzedającego naturalne serum do twarzy. Klient pyta Perplexity, które marki oferują serum bez parabenów, bezpieczne dla skóry wrażliwej po wielokrotnym stosowaniu. Jeśli strony produktów chowają tę właściwość w ogólnych opisach marketingowych, a opinie klientów wspominające o niej siedzą w widgecie, którego crawlery nie indeksują, nie ma nic czytelnego do ugruntowania, więc marka nie zostaje zacytowana, mimo że prawdziwi klienci dokładnie to opisali. Jeśli ta sama właściwość jest podana wprost na stronie produktu i potwierdzona przez czytelne, indeksowalne opinie mówiące to samo słowami klientów, marka staje się cytowanym źródłem. Silnik odpowiedzi AI może ugruntować zdanie o składzie serum na fragmencie, który faktycznie może zacytować.

Dlatego grounding stoi w centrum widoczności w silnikach odpowiedzi AI. ChatGPT, Perplexity i Google AI Overviews coraz częściej pobierają dane przed udzieleniem odpowiedzi, a zacytowane zostaje właśnie to, co pobiorą. Optymalizacja pod kątem groundingu nie polega na manipulowaniu modelem, lecz na tym, żeby twoje informacje były łatwe do odczytania i łatwe do zweryfikowania, żeby przetrwały etap pobierania danych.

Uczciwe zastrzeżenie: grounding zmniejsza liczbę halucynacji, ale ich nie eliminuje. Model może oprzeć się na źródle i nadal je źle zinterpretować albo zacytować stronę, która właściwie nie popiera danego zdania. Cytowanie jest dowodem istnienia źródła, nie dowodem, że źródło się z nim zgadza. Uczynienie istniejących opinii czytelnymi, wzajemnie potwierdzającymi się i faktycznie cytowalnymi przez wyszukiwarki i AI to luka, którą zamyka BeyondReviews.