オブザーバビリティ【observability】可観測性
概要
オブザーバビリティとは、システムの内部状態や挙動を外部から観測可能な情報によって把握できる能力。また、その度合い。システムの運用管理や障害対応の効率化を進める上で重要な概念である。
目
次
次

モニタリングとの違い
システムの状態を把握する手法として従来から「モニタリング」(monitoring:システム監視)があるが、これは主に、CPU使用率、エラー発生率といった事前に決められた定量的な指標(メトリクス)を継続的に測定し、設定された閾値を超えたら警告するといった手法が中心となる。
一方、オブザーバビリティの考え方では、事前に決めたメトリクス以外にもシステムから様々なデータを取得し、組み合わせて分析する。これにより、異常の兆候を未然に察知したり、予期せぬ問題が生じたときに原因を迅速に特定するといった対処を可能にする。単一の障害にとどまらず、複雑な依存関係を持つ分散システムの挙動も把握しやすくなる。
三つの柱
オブザーバビリティを高めるために取得するデータ(テレメトリシグナル)は以下の「三つの柱」として整理される。「メトリクス」(metrics)は従来からモニタリングで取得するデータと同じで、機器やアプリケーションの稼働状態を表す数値的な指標群を時系列で継続して取得したものである。
「ログ」(log)は、システム内で何らかの事象(イベント)が発生した際に、その内容を日時ともに時系列に記録したものである。問題の発生箇所や重大度、内容を知る手がかりとなる。「トレース」(trace)は、システムに対する要求(リクエスト)がどのようなサービスやコンポーネントによって処理されたかを追跡して記録したものである。マイクロサービスやクラウドサービスなど分散した複数の要素が連携して動作するシステムの健全性把握のために特に重要となる。
(2025.11.28更新)