リランキング

RAGの検索精度を向上させるテクニック。初回検索で多めに候補を取得し、より精密なモデルで関連度を再評価してTop-Kに絞る。

仕組み

  1. 初回検索: ベクトルデータベースでTop-20〜50件を取得
  2. リランキング: 専用モデルでクエリとの関連度を再計算
  3. 絞り込み: 上位5〜10件に絞ってLLMに渡す

なぜリランキングが必要か

ベクトル検索の限界

埋め込みは意味の近さを捉えるが完璧ではない:

リランキングで3番を1位に引き上げることができる。

リランキングモデル

専用モデル

特徴

リランキングの戦略

1. 2段階検索

ステップ1: ベクトル検索でTop-50(高速だが粗い)
ステップ2: リランカーでTop-5に絞る(遅いが精密)

2. LLM自身でリランキング

コストとレイテンシ

手法 レイテンシ コスト
ベクトル検索のみ 10〜50ms
ベクトル検索 + リランキング 100〜500ms
LLMでリランキング 1000〜3000ms

使い分け

リランキングの限界

  1. レイテンシ増加: 候補ごとに推論が必要で時間がかかる
  2. コスト: API利用の場合、従量課金が増加
  3. 過剰最適化リスク: リランカーが特定パターンに偏る可能性

ベストプラクティス

  1. 初回検索は広めに: Top-20〜50件を取得
  2. リランキング後は絞る: Top-5〜10件に絞ってLLMに渡す
  3. キャッシュを活用: 同じクエリのリランキング結果をキャッシュ
  4. 評価データで検証: リランキングが実際に精度を上げているか測定

関連