service-mesh-observability
快速設定服務網格可觀測性
服務網格遙測資料很難在追蹤、指標和儀表板之間串接。本技能提供 Istio 和 Linkerd 可觀測性的現成範本和查詢。
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「service-mesh-observability」。 Give me a concise checklist to enable Istio observability with Prometheus and Jaeger.
預期結果:
- Deploy Prometheus with the Istio scrape config and ServiceMonitor.
- Enable tracing in Istio and point Zipkin to Jaeger collector.
- Install Jaeger all-in-one and expose the UI port.
- Add PromQL panels for request rate, errors, and P99 latency.
正在使用「service-mesh-observability」。 How do I check which services are making the most requests?
預期結果:
- Use Linkerd viz top command: linkerd viz top deploy/my-app
- Or query Prometheus: sum(rate(istio_requests_total[5m])) by (destination_service_name)
- Check the Grafana Istio dashboards for visualized request rates by service.
正在使用「service-mesh-observability」。 Set up alerting for high error rates.
預期結果:
- Create a PrometheusRule with expression: sum(rate(istio_requests_total{response_code=~"5.."}[5m])) by (destination_service_name) / sum(rate(istio_requests_total[5m])) by (destination_service_name) > 0.05
- Set for: 5m threshold to avoid alert flapping.
- Label with severity: critical and include service name in summary.
安全審計
安全Pure documentation skill containing YAML templates, PromQL queries, and CLI examples for service mesh observability. All static findings are false positives: the scanner misinterpreted PromQL metric names (containing 'md5', 'sha' substrings) as weak crypto, flagged documentation links as network IOCs, and misidentified YAML field names as path traversal. The content is static documentation that matches its stated purpose exactly.
風險因素
🌐 網路存取 (12)
⚙️ 外部命令 (17)
📁 檔案系統存取 (1)
品質評分
你能建構什麼
建立網格監控
使用範本為新的服務網格串接 Prometheus、Grafana 和追蹤功能。
調查延遲高峰
應用 PromQL 查詢和追蹤設定來找出高延遲服務。
定義網格 SLO
使用黃金信號指導來為服務建立 SLO 和警報規則。
試試這些提示
列出在新叢集中啟用 Istio 指標和追蹤的最低限度步驟和範本。
提供按服務分類的請求率、錯誤率和 P99 延遲的關鍵 PromQL 查詢。
提供用於分散式追蹤的 IstioOperator 和 Jaeger 部署範例。
將 Prometheus、Grafana、Jaeger、Kiali 和 OTel 範本組合成階段性部署計劃。
最佳實務
- 在開發環境中高取樣追蹤,在生產環境中降低取樣以控制成本。
- 在所有服務中使用一致的追蹤上下文傳播。
- 使用 PrometheusRule 中定義的清晰閾值對黃金信號進行警報。
避免
- 在 Prometheus 上收集高基數標籤而沒有限制。
- 在生產環境中預設執行 100% 追蹤。
- 在沒有服務依賴關係和拓撲儀表板的情況下運作。