monitoring-observability
監視と可観測性のセットアップ
このスキルは、開発者和DevOpsエンジニアがPrometheusやGrafanaなどの業界標準ツールを使用して包括的な監視、ロギング、アラートシステムの実装を支援します。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「monitoring-observability」を使用しています。 ExpressアプリのPrometheusメトリクスをセットアップ
期待される結果:
リクエスト持續時間のカスタムヒストグラム、リクエスト総数のカウンター、デフォルトシステムメトリクスを含むメトリクスエンドポイント設定。
「monitoring-observability」を使用しています。 高エラー率のアラートを作成
期待される結果:
5分評価、5xxエラーに対して5%の閾値、重大度ラベルを持つPrometheusアラートルール。
セキュリティ監査
安全This is a documentation skill containing example code for monitoring systems. All static findings are false positives: the detected patterns are legitimate code examples (TypeScript, YAML), standard Node.js environment variable usage for configuration, documentation links to known monitoring tools, and Prometheus query syntax. No actual security risks present.
検出されたパターン
品質スコア
作れるもの
本番監視セットアップ
アプリケーションを本番環境にデプロイする前に包括的な監視をセットアップ
インシデント対応準備
インシデント中の迅速な根本原因特定のためのアラートルールとダッシュボードを作成
パフォーマンス最適化
メトリクス収集と可視化を通じてパフォーマンスボトルネックを特定
これらのプロンプトを試す
Node.js ExpressアプリケーションのPrometheusメトリクス収集をセットアップしてください。デフォルトメトリクスとHTTPリクエスト持續時間のカスタムヒストグラムを含めること。
高エラー率(5xxエラーが5%以上)、応答遅延(p95が1秒以上)、サービス停止のためのPrometheusアラートルールを作成してください。
JSONフォーマット、タイムスタンプ、エラースタックトレースを含むWinstonロガーをNode.jsアプリケーションに実装してください。
データベース接続、Redisの可用性をチェックし、全体的なサービスステータスを返す/healthエンドポイントを作成してください。
ベストプラクティス
- アラート疲れを防ぐため、警告をセットアップする前に明確なサービスレベル目標(SLO)を定義する
- Prometheusのパフォーマンス問題を避けるため、高カーディナリティラベルを注意して使用する
- 各アラートのランブックを作成して迅速なインシデント対応を可能にする
回避
- パスワード、APIキー、個人を特定できる情報などの機密データをログに記録しない
- アラート疲れと無視される通知につながるアラートを過度に作成しない
- メトリクスにユーザーIDやセッショントークンなどの高カーディナリティラベルを使用しない
よくある質問
メトリクスとログの違いは何ですか?
監視におけるGolden Signalsとは何ですか?
アラート疲れを防ぐにはどうすればいいですか?
Prometheusのプルモデルとは何ですか?
カスタムビジネスメトリクスを監視するにはどうすればいいですか?
ヘルスチェックには何が含まれるべきですか?
開発者の詳細
作成者
supercent-ioライセンス
MIT
リポジトリ
https://github.com/supercent-io/skills-template/tree/main/.agent-skills/monitoring-observability/参照
main
ファイル構成
📄 SKILL.md