スキル monitoring-observability
📊

monitoring-observability

安全

監視と可観測性のセットアップ

このスキルは、開発者和DevOpsエンジニアがPrometheusやGrafanaなどの業界標準ツールを使用して包括的な監視、ロギング、アラートシステムの実装を支援します。

対応: Claude Codex Code(CC)
📊 71 十分
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「monitoring-observability」を使用しています。 ExpressアプリのPrometheusメトリクスをセットアップ

期待される結果:

リクエスト持續時間のカスタムヒストグラム、リクエスト総数のカウンター、デフォルトシステムメトリクスを含むメトリクスエンドポイント設定。

「monitoring-observability」を使用しています。 高エラー率のアラートを作成

期待される結果:

5分評価、5xxエラーに対して5%の閾値、重大度ラベルを持つPrometheusアラートルール。

セキュリティ監査

安全
v1 • 3/10/2026

This is a documentation skill containing example code for monitoring systems. All static findings are false positives: the detected patterns are legitimate code examples (TypeScript, YAML), standard Node.js environment variable usage for configuration, documentation links to known monitoring tools, and Prometheus query syntax. No actual security risks present.

2
スキャンされたファイル
417
解析された行数
0
検出結果
1
総監査数
セキュリティ問題は見つかりませんでした

検出されたパターン

External Commands False PositiveNetwork Access False PositiveEnvironment Variable False PositivePath Traversal False Positive
監査者: claude

品質スコア

38
アーキテクチャ
100
保守性
87
コンテンツ
32
コミュニティ
100
セキュリティ
91
仕様準拠

作れるもの

本番監視セットアップ

アプリケーションを本番環境にデプロイする前に包括的な監視をセットアップ

インシデント対応準備

インシデント中の迅速な根本原因特定のためのアラートルールとダッシュボードを作成

パフォーマンス最適化

メトリクス収集と可視化を通じてパフォーマンスボトルネックを特定

これらのプロンプトを試す

基本的なPrometheusセットアップ
Node.js ExpressアプリケーションのPrometheusメトリクス収集をセットアップしてください。デフォルトメトリクスとHTTPリクエスト持續時間のカスタムヒストグラムを含めること。
アラート設定
高エラー率(5xxエラーが5%以上)、応答遅延(p95が1秒以上)、サービス停止のためのPrometheusアラートルールを作成してください。
構造化ログ
JSONフォーマット、タイムスタンプ、エラースタックトレースを含むWinstonロガーをNode.jsアプリケーションに実装してください。
ヘルスチェックエンドポイント
データベース接続、Redisの可用性をチェックし、全体的なサービスステータスを返す/healthエンドポイントを作成してください。

ベストプラクティス

  • アラート疲れを防ぐため、警告をセットアップする前に明確なサービスレベル目標(SLO)を定義する
  • Prometheusのパフォーマンス問題を避けるため、高カーディナリティラベルを注意して使用する
  • 各アラートのランブックを作成して迅速なインシデント対応を可能にする

回避

  • パスワード、APIキー、個人を特定できる情報などの機密データをログに記録しない
  • アラート疲れと無視される通知につながるアラートを過度に作成しない
  • メトリクスにユーザーIDやセッショントークンなどの高カーディナリティラベルを使用しない

よくある質問

メトリクスとログの違いは何ですか?
メトリクス adalah 数値測定値(リクエスト率など)で一定間隔で収集され、ログは詳細なコンテキストを持つ離散イベントです。アラートとダッシュボードにはメトリクスを、特定の問題のデバッグにはログを使用します。
監視におけるGolden Signalsとは何ですか?
Golden Signalsは4つの重要なメトリクスです:レイテンシ(応答時間)、トラフィック(リクエスト量)、エラー(エラー率)、サチュレーション(リソース使用率)。これらにより包括的なシステム正常性の可視化が実現します。
アラート疲れを防ぐにはどうすればいいですか?
即座の対応が必要な実行可能な問題のみにアラートを作成してください。適切な閾値と評価期間を設定し、各アラートのランブックを文書化してください。
Prometheusのプルモデルとは何ですか?
Prometheusはアプリケーションがデータをプッシュするのではなく、ターゲットから設定された間隔でメトリクスをスクレイプします。これにより信頼性が向上し、アプリケーションコードが簡素化されます。
カスタムビジネスメトリクスを監視するにはどうすればいいですか?
Prometheusクライアントライブラリを使用して、アプリケーションコードでカスタムカウンター、ゲージ、ヒストグラム、またはサマリーを定義してください。/metricsエンドポイントを通じてそれらを公開します。
ヘルスチェックには何が含まれるべきですか?
ヘルスチェックでは重要な依存関係(データベースキャッシュ、外部API)を検証し、全体的なステータス(healthy/degraded/unhealthy)を返し、各チェックのレイテンシ情報を含める必要があります。

開発者の詳細

ファイル構成

📄 SKILL.md

📄 SKILL.toon