AI検索

AIハルシネーション（幻覚）

別名: ハルシネーション, AIの幻覚, AI hallucination, AIが嘘をつく

AIハルシネーションとは、言語モデルが誤った内容を事実であるかのように述べる現象で、存在しない事実や引用、詳細を、正しい回答と変わらない自信のある口調で提示することを指します。モデルが検証済みの情報を取り出すのではなく、もっともらしい文章を予測しているために起こります。

ハルシネーションが起こるのは、言語モデルが最も正確な語ではなく、次に来る可能性が最も高い語を生成しているためです。モデルは正しく聞こえる言葉の形を学習しているため、対象について本当の知識を持たなくても、流暢で整った主張を作り出せます。下敷きになる本物の情報がないとき、モデルは立ち止まったり知識の欠落を知らせたりはせず、その空白を、でっち上げた商品仕様、架空の引用、実際には設定されていない価格、あるいは存在しないページを指す出典で埋めてしまいます。重要なのは、根拠のある回答でも推測した回答でも口調がまったく同じだという点で、これが文章を読むだけではハルシネーションを見抜きにくい理由です。

メリノウールのインナーを販売するShopifyストア運営者を例に考えてみます。ある買い物客が、このブランドは生涯修理保証を提供しているかとアシスタントに尋ねます。ストアはそのような方針を一度も掲載していませんが、同種のアウトドアブランドは保証を設けていることが多いため、モデルはそれを推測し、はっきりとこう述べます。「はい、生涯にわたり無償修理に対応しています」と。買い物客は、運営者がした覚えのない約束を期待して来店します。何も取り出されてはおらず、その主張は類似ブランドという統計的な近傍から組み立てられただけです。同じ仕組みが、実際の商品ページと食い違う洗濯方法や繊維の混用率、サイズの助言までも作り出します。

最も信頼できる対策は、回答時にモデルを取り出した情報源に根拠づけること、つまり検索拡張生成（RAG）の考え方です。システムが実在の文書を引き出し、そこからのみ回答するとき、モデルは情報をでっち上げるのではなく証拠を要約しているため、ハルシネーションは大きく減ります。これは、モデルがあなたのブランドについて何を語るかが、モデルが何を見つけられるかに左右される理由でもあります。商品、ポリシー、価格についての正確で裏付けのある情報が簡単に取り出せれば、モデルはカテゴリの平均から推測する代わりに、拠り所となる真実を手にできます。

ChatGPT、Perplexity、Google AI OverviewsといったAI回答エンジンにとって、このことはハルシネーションを、明確に情報を公開すべき実務上の理由へと変えます。これらのシステムは、あなたのサイト、構造化データ、第三者の情報源を通じて読み取れる内容に頼っています。情報が乏しかったり矛盾していたりすると、モデルが捏造で埋める空白は広がり、一貫して具体的で、マークアップの整った事実はその空白を狭めます。顧客のレビューもここで役立ちます。サイズ感や耐久性、対応について、モデルが引用できる言葉で実際の主張を裏付けてくれるからです。

ハルシネーションは完全にはなくならず、減らせるだけです。そのため、価格、在庫、仕様についての出典のないAIの主張は、一次情報源と照合するまでは未確認のものとして扱ってください。運営者にとっての誠実な要点は二つあります。何もない状態でモデルが何を捏造するかは制御できませんが、実在する引用可能な情報を見つけやすくすることでその空白を狭めることはできます。そして、自信に満ちた誤りを顧客より先に見つけるために、主要なアシスタントに自分のストアについて定期的に尋ねてみるとよいでしょう。