监控复杂系统需要清晰的指标可视化。此技能帮助您创建生产就绪的 Grafana 仪表板,提供对基础设施和应用程序性能的可操作洞察。
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“grafana-dashboards”。 创建一个显示总活动连接数的统计面板
预期结果:
一个 Stat 面板配置,包含汇总活动连接指标的 Prometheus 查询、正常/警告/严重状态的颜色阈值,以及启用自动刷新
正在使用“grafana-dashboards”。 为请求延迟分布构建热图
预期结果:
一个 Heatmap 面板,Y 轴为直方图桶,X 轴为时间,颜色强度表示每个延迟桶的请求频率
安全审计
安全Static analysis produced false positives by misinterpreting markdown code block delimiters (```) as shell execution and configuration examples as suspicious patterns. The skill contains only documentation with JSON, YAML, and HCL examples for Grafana dashboard configuration. No actual code execution, network access, or filesystem operations are present.
质量评分
你能构建什么
DevOps 工程师构建监控栈
为新的 Kubernetes 集群创建全面的仪表板,实现包含节点指标、Pod 状态和资源利用率面板的基础设施监控。
SRE 实施 SLO 跟踪
构建服务可靠性仪表板,可视化微服务之间的错误预算、可用性指标和延迟百分位数。
开发者添加应用程序可观测性
设计特定于应用程序的仪表板,展示新功能的需求速率、错误率、响应时间和业务 KPI。
试试这些提示
创建一个用于监控 REST API 的 Grafana 仪表板 JSON 配置,包含请求率、错误率和响应时间百分位数的面板。
使用 USE 方法生成完整的基础设施仪表板。为 Kubernetes 集群包含 CPU 利用率、内存使用率、磁盘 I/O 和网络流量的面板。
向仪表板面板添加告警条件,当错误率超过 5% 持续 5 分钟时触发,包含 Slack 通知配置。
生成 Terraform 配置,从存储在 Git 仓库的 JSON 文件配置 Grafana 仪表板,包括文件夹组织和自动更新。
最佳实践
- 分层组织面板:关键指标在顶部,趋势在中部,详细数据在底部
- 使用仪表板变量进行命名空间、服务和环境过滤,无需复制仪表板即可实现筛选
- 根据指标关键性设置适当的刷新间隔——生产环境 30 秒,容量规划 5 分钟
避免
- 避免仪表板过于拥挤——专注于可操作的指标,而不是数据倾倒
- 对于计数器指标,不要使用没有 rate() 或 increase() 函数的原始指标查询
- 在未了解基线行为和正常波动范围之前,切勿设置告警阈值