セマンティック検索(Semantic Search)
セマンティック検索とは、キーワードの完全一致ではなく意味に基づいて結果を取り出す検索方式で、検索クエリと候補となる文書をそれぞれ埋め込み(数値ベクトル)に変換し、そのベクトルが空間上でどれだけ近いかで順位づけします。そのため、共通する単語が一つもなくても、ページが質問に一致することがあります。
従来のキーワード検索は単語の重なりを数えていました。検索された単語を多く繰り返したページが上位に表示されるという仕組みです。これに対してセマンティック検索は概念の近さを測ります。そのため「トレイルランニングに耐えるシューズ」という質問が、共通する単語を持たない「悪路に強いオフロードスニーカー」という説明の商品を引き出すことができます。こうした変化が生まれるのは、クエリと文書の両方が意味を表すベクトル(埋め込み)に変換され、システムがその距離で順位づけするからです。キーワードの詰め込みが効力を失ったのはこのためです。同じ語句を繰り返してページを埋めてもベクトルはほとんど動きませんが、概念を素直に述べた明確で具体的な文章は、重要なクエリに近づく傾向があります。
実践的な教訓は、顧客が実際に尋ねるであろう言葉で書くこと、そして主題をコンテンツの上部近くで直接的な言葉で定義し、埋もれさせないことです。具体性は埋め込みが本物の意味を運ぶ助けになります。「水深50メートルまで防水」は「水まわりに最適」よりも泳ぐ人の質問に近い位置に来ます。モデルが位置を特定できる具体的な属性を名指ししているからです。曖昧で宣伝的な言い回しは空間の中心へ漂いやすく、どのクエリにも近いようでいて、結局どれにも近くない位置に落ち着いてしまいます。
鋳鉄製の調理器具を販売するShopifyストアを考えてみます。買い物客がアシスタントに「コンロからオーブンへそのまま移しても変形しないフライパンは」と尋ねます。商品ページにはその言葉は一度も使われていません。ですが「シーズニング済みのスキレット、オーブン260度まで対応、プラスチック製の取っ手のない一体成形」とは書かれています。キーワード検索では、これらの表現はまったく結びつかないかもしれません。セマンティック検索ではこれらは近い位置に来ます。オーブン対応、一体成形、プラスチック製の取っ手がないことが、合わさってコンロからオーブンへ安全に移すという概念を表しているからです。ストアは正確なクエリを推測することではなく、属性を正直に説明することで一致を勝ち取ります。同じ理屈はレビューにも当てはまります。「220度のオーブンに1時間入れたままにしても形を保ちました」と書く顧客は、マーケターなら書かないような言葉でその概念を補強しており、これは本物のレビュー文章が情報の取り出しにとって有用な素材である理由の一つです。
セマンティックな情報の取り出しは、ほとんどのAI回答の土台にもなっています。ChatGPT、Perplexity、Google AI Overviewsが回答の前に情報源を集めるとき、通常は文字どおりのキーワードではなく埋め込みの類似度によって取り出し、見つけたものを要約します。したがって属性を素直に名指しする文章は、こうしたシステムが取り出して引用しやすくなります。述べておくべき注意点として、類似性は正確性ではありません。ページは話題が近いという理由で取り出されても、内容が誤っていることはあり得ます。これがAI回答エンジンが独立した複数の情報源どうしの裏づけに頼る理由の一つであり、一貫して事実に即した商品説明が、巧妙な説明よりも頻繁に引用される傾向がある理由でもあります。
