技能 database-migrations-migration-observability
📦

database-migrations-migration-observability

低风险 ⚙️ 外部命令🌐 网络访问🔑 环境变量

构建迁移可观测性和 CDC 管道

数据库迁移缺乏对进度、错误和数据一致性的可见性。此技能提供企业级可观测性,包括实时指标、异常检测和自动告警。

支持: Claude Codex Code(CC)
🥉 72 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“database-migrations-migration-observability”。 设置带有指标的 MongoDB 迁移

预期结果:

可观测迁移类,包含用于持续时间的 Prometheus 直方图、用于已处理文档的计数器,以及 winston 日志记录到文件和控制台。暴露指标端点供 Prometheus 抓取。

正在使用“database-migrations-migration-observability”。 为 PostgreSQL 配置 Debezium CDC

预期结果:

Kafka Connect 连接器配置,使用 pgoutput 插件、心跳间隔,以及消费者延迟和复制延迟的指标。事件流式传输到 database.changes 主题。

正在使用“database-migrations-migration-observability”。 为迁移创建 Grafana 仪表板

预期结果:

Grafana 仪表板包含迁移速率(每秒行数)、带颜色阈值的数据延迟(秒)和随时间变化的错误率面板。通过 Grafana API 自动配置。

安全审计

低风险
v1 • 2/24/2026

Static analyzer flagged 24 patterns but all are false positives. The skill uses standard monitoring libraries (prometheus-client, kafka-python, requests) for legitimate observability purposes. Network calls target infrastructure APIs (Kafka Connect, Grafana, Slack webhooks) as expected for monitoring. No shell execution, cryptographic operations, or suspicious patterns found. Minor risk due to network access for webhook integrations.

1
已扫描文件
423
分析行数
4
发现项
1
审计总数
低风险问题 (1)
HTTP requests to external services
Skill makes HTTP requests to Kafka Connect API, Grafana API, and Slack webhooks for monitoring purposes. This is expected behavior for observability infrastructure but requires API credentials.

风险因素

⚙️ 外部命令 (1)
🌐 网络访问 (3)
🔑 环境变量 (1)
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
50
社区
88
安全
91
规范符合性

你能构建什么

零停机生产迁移

实时监控大规模数据库迁移,当数据延迟超过阈值或错误率飙升时自动告警。

CDC 管道实施

使用 Debezium 设置从 PostgreSQL 到目标系统的变更数据捕获,跟踪复制延迟和事件吞吐量。

迁移仪表板自动化

以编程方式生成 Grafana 仪表板,显示迁移进度、数据延迟和错误率,支持基于阈值的告警。

试试这些提示

基础迁移监控设置
创建可观测的 MongoDB 迁移脚本,包含用于持续时间和文档计数的 Prometheus 指标。包含使用 winston 的结构化日志。
使用 Debezium 的 CDC 管道
为 PostgreSQL 设置 Debezium CDC 连接器与 Kafka。配置已处理事件、消费者延迟和复制延迟的指标。
异常检测和告警
实现针对迁移吞吐量和错误率的异常检测。当吞吐量降至预期的 50% 以下或错误率超过 1% 时,向 Slack 发送告警。
完整可观测性堆栈
创建完整的迁移可观测性解决方案,包括 Prometheus 指标、Grafana 仪表板自动化、Slack 告警和用于健康检查的 CI/CD 集成。

最佳实践

  • 始终对迁移原子性和回滚支持使用基于会话执行的事务
  • 在 CDC 连接器中设置心跳间隔(10 秒)以快速检测复制停滞
  • 配置多个告警渠道(Slack、电子邮件),根据严重性路由关键告警与警告告警

避免

  • 不要跳过指标注册 - 不可观测的迁移无法监控异常
  • 避免进度跟踪的轮询间隔超过 30 秒 - 会延迟异常检测
  • 切勿在仪表板配置中发送凭据 - 使用环境变量或密钥管理

常见问题

CDC 支持哪些数据库?
PostgreSQL 通过 pgoutput 插件获得完全支持。MongoDB、MySQL 和 SQL Server 需要额外的 Debezium 连接器配置。
异常检测如何工作?
系统监控每秒行数和错误率。当吞吐量降至预期的 50% 以下或错误率超过 1% 时触发告警。
可以在不使用 Kafka 的情况下使用吗?
基础迁移可观测性无需 Kafka 即可工作。CDC 管道需要 Kafka 进行事件流式传输。
Grafana 仪表板如何创建?
仪表板使用 bearer token 认证通过 Grafana API 自动配置。仪表板 JSON 以编程方式生成。
默认收集哪些指标?
迁移持续时间、已处理文档/行数、错误计数、消费者延迟和复制延迟(秒)。
如何与 CI/CD 集成?
使用提供的 GitHub Actions 工作流模板,包含验证迁移完成和数据延迟阈值健康检查步骤。