Question 1

メトリクスとログの違いは何ですか？

Accepted Answer

メトリクス adalah 数値測定値（リクエスト率など）で一定間隔で収集され、ログは詳細なコンテキストを持つ離散イベントです。アラートとダッシュボードにはメトリクスを、特定の問題のデバッグにはログを使用します。

Question 2

監視におけるGolden Signalsとは何ですか？

Accepted Answer

Golden Signalsは4つの重要なメトリクスです：レイテンシ（応答時間）、トラフィック（リクエスト量）、エラー（エラー率）、サチュレーション（リソース使用率）。これらにより包括的なシステム正常性の可視化が実現します。

Question 3

アラート疲れを防ぐにはどうすればいいですか？

Accepted Answer

即座の対応が必要な実行可能な問題のみにアラートを作成してください。適切な閾値と評価期間を設定し、各アラートのランブックを文書化してください。

Question 4

Prometheusのプルモデルとは何ですか？

Accepted Answer

Prometheusはアプリケーションがデータをプッシュするのではなく、ターゲットから設定された間隔でメトリクスをスクレイプします。これにより信頼性が向上し、アプリケーションコードが簡素化されます。

Question 5

カスタムビジネスメトリクスを監視するにはどうすればいいですか？

Accepted Answer

Prometheusクライアントライブラリを使用して、アプリケーションコードでカスタムカウンター、ゲージ、ヒストグラム、またはサマリーを定義してください。/metricsエンドポイントを通じてそれらを公開します。

Question 6

ヘルスチェックには何が含まれるべきですか？

Accepted Answer

ヘルスチェックでは重要な依存関係（データベースキャッシュ、外部API）を検証し、全体的なステータス（healthy/degraded/unhealthy）を返し、各チェックのレイテンシ情報を含める必要があります。

monitoring-observability

テストする