OpenClaw contextPruning設定ガイド

コスト削減: キャッシュヒット時は入力トークンが90%割引
応答速度向上: キャッシュ部分の処理がスキップされレイテンシ短縮

概要

agents.defaults.contextPruning.mode はセッションのツール結果をどう扱うかを制御する設定。

値	説明
`"off"`	デフォルト。プルーニングを無効化。ツール結果を全て保持
`"cache-ttl"`	TTL対応プルーニング。最後のAPI呼び出しから一定時間（デフォルト5分）経過後、古いツール結果を削除

※ "adaptive" は無効な値（2026.1.21時点）

Anthropic API の機能で、同じプロンプトの先頭部分を再利用することでコストと応答時間を削減する仕組み。

[システムプロンプト]     ← キャッシュから読み込み（安い・速い）
[過去の会話履歴]        ← キャッシュから読み込み
[新しいユーザーメッセージ] ← 新規処理

コンテキストの内容が変わるので以前のキャッシュは無効化されるが、スリムなコンテキストが新しいキャッシュのベースになる。「既存キャッシュを活用する」ではなく「不要なデータを捨てて次のキャッシュを効率的に始める」という戦略。

コンテキスト上限に達すると compaction が発動：

エラーにはならず、自動的に会話を圧縮して続行。