コンテキストウィンドウ

LLMが一度に処理できる入力と出力の合計トークン数の上限。ワーキングメモリのAI版とも言える制約。

特徴

トークン数で計測（モデルにより数千〜数百万トークン）
入力（プロンプト）と出力（レスポンス）の合計
ウィンドウを超えると古い情報から「忘れる」

コンテキスト管理の重要性

コンテキストウィンドウは有限リソースであり、効率的な管理が必要：

圧迫すると品質劣化: 限界まで埋めると応答品質が下がる
オーバーヘッドの考慮: サブエージェント呼び出しには約20kトークンのオーバーヘッド
段階的開示: 段階的開示パターンで必要な情報のみ読み込む

コンテキスト分離

サブエージェントは独自のコンテキストウィンドウを持つ。これにより：

メインの会話を汚染しない
並列で複数タスクを処理できる
結果のサマリーのみをメインに返却

関連