Búsqueda con IA

Generación aumentada por recuperación (RAG)

También: RAG, Retrieval-Augmented Generation, generación aumentada con recuperación

La generación aumentada por recuperación (RAG) es una técnica en la que un modelo de lenguaje primero recupera documentos relevantes de una fuente externa y luego genera su respuesta apoyándose en ese texto recuperado, de modo que la respuesta refleja material concreto y citable, no solo lo que el modelo recuerda de su entrenamiento.

RAG es la forma en que funcionan la mayoría de los motores de respuesta actuales. Cuando haces una pregunta, el sistema ejecuta un paso de recuperación (normalmente una búsqueda semántica sobre un índice de documentos), extrae los pasajes que considera más relevantes y se los entrega al modelo como contexto. El modelo escribe entonces una respuesta basada en esos pasajes, y por eso herramientas como ChatGPT, Perplexity y Google AI Overviews pueden nombrar fuentes y enlazarlas: la fuente está literalmente delante del modelo en el momento de generar. Sin recuperación, un modelo solo puede parafrasear lo que hubiera en sus datos de entrenamiento, que pueden estar desactualizados, ser genéricos o sencillamente faltar para un producto de nicho.

El proceso tiene dos etapas, y cada una puede fallar por separado. La recuperación decide qué documentos entran en la ventana de contexto; la generación decide qué hace el modelo con ellos. Una página puede estar perfectamente escrita y aun así perder en la etapa de recuperación porque nunca se indexó, nunca se dividió en pasajes que un recuperador pueda emparejar o nunca la corroboraron otras fuentes en las que el sistema confía. A la inversa, una recuperación sólida todavía puede producir una respuesta débil si los pasajes de base son pobres o contradictorios. Optimizar para la búsqueda con IA significa cuidar ambas etapas, no solo la prosa que leería una persona.

Piensa en una tienda de Shopify que vende camisetas técnicas de lana merino. Un comprador abre ChatGPT y pregunta qué marca aguanta mejor después de muchos lavados. El asistente recupera lo que encuentra sobre ese comportamiento exacto: hilos de foros, un par de comparativas editoriales y cualquier texto de reseña publicado en forma legible y estructurada. Si la tienda mantiene sus 900 reseñas encerradas dentro de un widget de JavaScript que se renderiza después de cargar la página, el recuperador a menudo ve una cáscara vacía y no extrae nada. Una competidora cuyas reseñas están en HTML rastreable, marcadas con schema de Product y Review, es la que acaba citada, incluso con menos reseñas en total.

RAG no garantiza que la respuesta sea correcta, y conviene ser honestos con eso. El modelo todavía puede malinterpretar un pasaje, mezclar dos fuentes o citar una página que en realidad no respalda la afirmación. La calidad de la recuperación también varía según la consulta, así que una página que gana una cita con una formulación puede ser invisible para una paráfrasis cercana. En el comercio, donde los compradores piden cada vez más a los asistentes de IA que comparen y recomienden productos, la brecha recurrente es que las reseñas reales de clientes existen pero no son legibles, ni están corroboradas ni indexadas en una forma que un recuperador vaya a extraer. Ser recuperable es la condición previa para todo lo demás: si tu contenido nunca entra en la ventana de contexto, la calidad de tu respuesta nunca llega a importar. Cerrar esa brecha es el trabajo en el que se centra BeyondReviews.

Términos relacionados

Para profundizar

Guía: ¿aparecen tus reseñas en ChatGPT? (en inglés) →