セマンティック検索

キーワードの文字列一致ではなく、意味の近さで情報を検索する技術。埋め込みを使って、クエリと文書の意味的類似度を計算する。

従来のキーワード検索との違い

キーワード検索(Grep):

セマンティック検索:

仕組み

  1. 文書を埋め込みモデルでベクトル化
  2. ベクトルデータベースに保存
  3. クエリも同じモデルでベクトル化
  4. ベクトル空間で類似度計算(コサイン類似度など)
  5. 最も近いTop-K件を返す

利点

限界

対策

主な用途

関連

参照