AI検索

大規模言語モデル（LLM）

別名: LLM, Large Language Model, 大規模言語モデル

大規模言語モデル（LLM）とは、膨大なテキストで学習し、次に続く言語を予測するニューラルネットワークです。ChatGPT、Claude、Geminiといったシステムの中核となるモデルで、記憶した事実を取り出すのではなく、トークンを一つずつ生成して自然な回答を組み立てます。

LLMは、検索インデックスのようにデータベースから答えを引き出すわけではありません。目の前にあるテキストに最も続きそうな言葉を、学習中に身につけた統計的なパターンにもとづいて予測します。モデルは言語を数値として表現し、どの並びの後にどの並びが続きやすいかを学び、もっともらしい次のトークンを選ぶ作業を、回答が完成するまで繰り返します。だからこそ同じ質問でも回答の言い回しが少しずつ変わり、また確かに学んだわけではないことについても自信ありげに語ることがあるのです。

この「取り出し」ではなく「予測」という設計は、ある商品やブランドが言及されるかどうかに直接かかわります。LLMは、学習データ全体や回答時に渡された情報源のなかで、何度も一貫して登場したエンティティ、主張、言葉を表に出しやすい傾向があります。情報が乏しかったり、矛盾していたり、検証できなかったりすると、モデルはその部分を飛ばしたり、誤って扱ったりしがちです。商品について明確で、繰り返し述べられ、複数の情報源で裏づけられた言葉こそ、モデルが正確に再現できる可能性が最も高いのです。

メリノウールのベースレイヤーを販売するShopifyのストア運営者を例に考えてみます。商品ページには洗濯機で洗えると書かれていますが、その主張を補強しているのは、あいまいな言い回しの顧客レビュー二件のなかに埋もれた記述だけです。買い物客がAI回答エンジンに「このベースレイヤーは洗濯機で洗えるか」と尋ねたとき、モデルが頼れる根拠は薄く、一貫していません。そのため、言葉を濁したり、その情報を省いたり、推測したりするおそれがあります。洗濯方法が商品ページにはっきり書かれ、なおかつ構造化された読みやすい複数のレビューでも繰り返されているカタログなら、モデルが引用できる一貫したシグナルが得られます。BeyondReviewsが取り組んでいるのは、まさにこの差を埋めることです。すでにあるレビューを、こうしたシステムが使えるだけの読み取りやすさと裏づけのある状態にします。

これが、LLMがとりわけAI検索にとって重要である理由です。ChatGPT、Perplexity、Google AI Overviewsは、かつてなら買い物客がクリックして訪れていたストアフロントとの間に入るようになりました。これらは要約し、比較し、推薦を行い、見つけて信頼できる言葉を頼りにします。自社のページでも第三者の情報源でも一貫して説明されているブランドは、その物語が散らばっていたり薄かったりするブランドよりも、忠実に表現してもらいやすいのです。

正直に付け加えるべき注意点があります。LLMには真偽を判断する仕組みが内蔵されておらず、あるのは「もっともらしさ」の判断だけです。そのため、流暢でありながら誤った内容を生み出すことがあります。これはハルシネーションと呼ばれる失敗のしかたです。今では多くの製品が、信頼できる情報源に対する検索（リトリーバル）とモデルを組み合わせて回答を裏づけており、これにより問題は減りますが、なくなるわけではありません。出力は確定した事実ではなく、検証すべき自信ありげな下書きとして扱ってください。