Recherche IA

Grand modèle de langage (LLM)

Aussi: LLM, Large Language Model, modèle de langage, IA générative de texte

Un grand modèle de langage (LLM) est un réseau de neurones entraîné sur d’énormes volumes de texte pour prédire le prochain fragment de langage. C’est le type de modèle derrière des systèmes comme ChatGPT, Claude et Gemini, qui génèrent des réponses fluides un token à la fois plutôt que de récupérer des faits stockés.

Un LLM ne va pas chercher des réponses dans une base de données comme le fait un index de recherche. Il prédit la suite la plus probable du texte qui lui est présenté, à partir des régularités statistiques apprises pendant l’entraînement. Le modèle représente le langage sous forme de nombres, apprend quelles séquences tendent à suivre quelles autres, puis échantillonne un token plausible, encore et encore, jusqu’à ce que la réponse soit complète. Voilà pourquoi une même question peut donner une formulation légèrement différente à chaque fois, et pourquoi un LLM peut paraître sûr de lui sur un point qu’il n’a jamais appris de façon fiable.

Cette logique de prédiction, et non de récupération, change la donne pour savoir si un produit ou une marque est cité. Un LLM tend à faire ressortir les entités, les affirmations et le langage qui apparaissaient souvent et de façon cohérente dans ses données d’entraînement et dans les sources qu’on lui fournit au moment de répondre. Une information rare, contradictoire ou invérifiable est facile à ignorer ou à mal restituer pour le modèle. Un langage clair, répété et corroboré au sujet d’un produit est ce que le modèle a le plus de chances de reproduire fidèlement.

Prenons un marchand Shopify qui vend un sous-vêtement technique en mérinos. Sa page produit indique qu’il passe en machine, mais la seule autre mention de ce point est enfouie dans deux avis clients à la formulation vague. Quand un acheteur demande à un moteur de réponse si ce vêtement supporte le lavage en machine, le modèle dispose d’éléments minces et incohérents, il peut donc rester prudent, omettre le détail ou deviner. Un catalogue où la consigne de lavage est énoncée clairement sur la page et reprise dans plusieurs avis structurés et lisibles donne au modèle un signal cohérent à citer. C’est précisément l’écart que BeyondReviews cherche à combler : rendre les avis existants assez lisibles et corroborés pour que ces systèmes puissent s’en servir.

Voilà pourquoi les LLM comptent en particulier pour la recherche IA. ChatGPT, Perplexity et Google AI Overviews s’intercalent désormais entre de nombreux acheteurs et les boutiques vers lesquelles ils auraient cliqué auparavant. Ils résument, comparent et recommandent, et ils s’appuient sur le langage qu’ils trouvent et auquel ils accordent du crédit. Une marque décrite de façon cohérente sur ses propres pages et sur des sources tierces est plus facile à représenter fidèlement qu’une marque dont le récit est dispersé ou ténu.

La réserve honnête : un LLM n’a aucune notion intrinsèque de vérité, seulement de probabilité, il peut donc produire des affirmations fluides mais fausses, un défaut connu sous le nom d’hallucination. De nombreux produits associent désormais le modèle à une récupération sur des sources de confiance pour ancrer ses réponses, ce qui réduit le problème sans l’éliminer. Traitez la sortie comme un brouillon assuré à vérifier, pas comme un fait établi.

Termes associés

Pour aller plus loin

Guide : comment l’IA lit vos avis produits (en anglais) →