コンテキストウィンドウ
LLMが一度に処理できる入力と出力の合計トークン数の上限。ワーキングメモリのAI版とも言える制約。
特徴
- トークン数で計測(モデルにより数千〜数百万トークン)
- 入力(プロンプト)と出力(レスポンス)の合計
- ウィンドウを超えると古い情報から「忘れる」
コンテキスト管理の重要性
コンテキストウィンドウは有限リソースであり、効率的な管理が必要:
- 圧迫すると品質劣化: 限界まで埋めると応答品質が下がる
- オーバーヘッドの考慮: サブエージェント呼び出しには約20kトークンのオーバーヘッド
- 段階的開示: 段階的開示パターンで必要な情報のみ読み込む
コンテキスト分離
サブエージェントは独自のコンテキストウィンドウを持つ。これにより:
- メインの会話を汚染しない
- 並列で複数タスクを処理できる
- 結果のサマリーのみをメインに返却