ひとことで言うと
可観測性。システム内部状態を外部から把握できる度合い。メトリクス・ログ・トレースで構成。
Observability(可観測性)とは、ログ・メトリクス・トレースといった外部から取得できる情報をもとに、システム内部で「いま何が起きているか」を推し量れる度合いのことです。単なる死活監視(落ちたかどうか)と違い、「なぜ遅いのか」「どのリクエストで失敗したか」まで後から追えるのが特徴で、障害対応や性能改善の土台になります。
生成AIアプリでも重要度が増しています。ClaudeなどのLLMはAPI呼び出しが連鎖し、応答時間やトークン消費が読みにくいため、各ステップを記録しておかないと不具合の原因切り分けが困難です。一般にログ・メトリクス・トレースの「3本柱」で構成され、これらをOpenTelemetryで収集しPrometheusやGrafanaで可視化する構成がよく使われます。