Question 1

このスキルはどのツールをサポートしていますか？

Accepted Answer

このスキルは、Prometheus、Grafana、Jaeger、Zipkin、ELK Stack、Loki、DataDog、New Relic、CloudWatch、OpenTelemetry、PagerDuty、および AWS、Azure、GCP 全体のクラウドネイティブモニタリングを含む主要なオブザーバビリティツールをカバーしています。

Question 2

このスキルはモニタリングインフラをデプロイできますか？

Accepted Answer

いいえ。このスキルは設計ガイダンス、設定推奨、実装計画を提供します。実際のデプロイには Terraform や Kubernetes などの別のインフラストラクチャツールが必要です。

Question 3

オブザーバビリティをどのように始めればよいですか？

Accepted Answer

重要なユーザージャーニーを特定し、信頼性の高いサービスが何を意味するかを定義することから始めます。次に、4 つの黄金のシグナル（レイテンシ、トラフィック、エラー、飽和）のためにインストルメントします。トレースとログは段階的に追加します。

Question 4

モニタリングとオブザーバビリティの違いは何ですか？

Accepted Answer

モニタリングは何が間違っているかを教えてくれます。オブザーバビリティはなぜ間違っているかを理解するのに役立ちます。モニタリングにはメトリクスとダッシュボードを、デバッグにはトレースを、深い調査にはログを使用します。

Question 5

アラートノイズをどのように削減しますか？

Accepted Answer

アラートグルーピング、重複排除、抑制ルールを使用します。内部コンポーネントの失敗ではなく、ユーザーに影響を与える症状に対してアラートを出します。迅速なトリアージを可能にするために、各アラートにランブックを実装します。

Question 6

SLI、SLO、エラーバジェットとは何ですか？

Accepted Answer

SLI はサービスの動作を測定します（例：リクエスト成功率）。SLO は目標とする SLI 値です（例：99.9% の成功率）。エラーバジェットは残りの許容障害時間です。これらを組み合わせることで、データ駆動型の信頼性判断が可能になります。

observability-engineer

テストする

セキュリティ監査

品質スコア

作れるもの

マイクロサービスモニタリングアーキテクチャの設計

SLI/SLO フレームワークの確立

分散トレーシングの実装

これらのプロンプトを試す

ベストプラクティス

回避

よくある質問

開発者の詳細