推論ベース検索

セマンティック検索の類似度マッチングではなく、LLMの推論能力を活用して情報を検索する手法。PageIndexが代表例。

核心的な洞察

「類似度 ≠ 関連性」

従来のベクトルベースRAGは意味的に近い文章を見つけるが、ドメイン知識や論理的推論を必要とする質問には弱い。

セマンティック検索との違い

観点 セマンティック検索 推論ベース検索
検索方法 埋め込みの類似度マッチング LLMによる推論的探索
関連性判断 コサイン類似度(数値) LLMの理解と推論
説明可能性 ブラックボックス ページ・セクション参照で追跡可能
適した用途 一般的な質問応答 専門的・複雑な文書

動作原理(PageIndexの例)

  1. ドキュメントを階層的なツリー構造に変換
  2. クエリに対してLLMがツリーを推論的に探索
  3. 各レベルで「このセクションは関連するか?」を判断
  4. 関連するセクションのみを深く掘り下げる

AlphaGoのツリー探索アルゴリズムに着想を得た「賢い枝刈り」。

利点

トレードオフ

関連