1章

監視はロールではなくジョブチーム全員でおこなう。勉強会などを開催し、知識を広める。
不安定なシステムに監視を追加するのではなく根本的な原因を改善する
監視ツールに依存しない、交換可能であるべき
現代では監視ツールの負荷が問題になることは少ない開発初期から導入する
チェックボックス監視という状態表面上だけの監視
- メトリクスは記録しているがシステムダウンの理由がわからない
- 誤検知が多いのでアラートを無視する
- 監視の間隔が長い（60secを基本とし、高トラフィックのシステムほど間隔を短くする）
監視設定やエージェントインストールは自動化する

2章