可観測性
Observability。システムの内部状態を外部から観測・理解できる能力。ログ、メトリクス、トレースを通じて、システムの振る舞いを把握する。
3つの柱
- ログ: イベントの記録
- メトリクス: 数値データの時系列
- トレース: リクエストの流れを追跡
認知負荷との関係
可観測性の向上は、認知負荷の不確実性に対処する手段。稼働プロダクトからのフィードバックを得やすくし、プロダクションモデルの精度を高める。
モニタリングとの違い
- モニタリング: 既知の問題を検出(閾値ベース)
- 可観測性: 未知の問題を調査可能にする(探索的)
実践
- 構造化ログ: JSONなど機械可読な形式
- 分散トレーシング: マイクロサービス間のリクエスト追跡
- ダッシュボード: メトリクスの可視化