ベクトルデータベース

ベクトル(数値の配列)を効率的に保存し、類似度検索に特化したデータベース。セマンティック検索RAGの基盤技術。

通常のデータベースとの違い

SQLデータベース:

ベクトルデータベース:

仕組み

  1. 埋め込みモデルが生成したベクトル(例: 1536次元の数値配列)を保存
  2. インデックスを構築(HNSW, IVFなど)
  3. クエリベクトルとの類似度を高速計算
  4. 最も近いTop-K件を返す

主なベクトルDB

クラウド型:

ローカル型:

類似度計算方法

インデックス技術

大規模データで高速検索を実現するための手法:

運用上の考慮点

  1. データの鮮度管理: 元データ更新時にベクトルも再生成が必要
  2. 削除データの同期: 元データ削除時にベクトルDBからも削除
  3. 権限管理: 誰が何を見られるかのフィルタリング
  4. コスト: クラウド型は従量課金、ローカル型はインフラコスト

主な用途

関連