数据质量问题会导致分析失败和管道中断。本技能提供经过验证的 Great Expectations、dbt 测试和数据契约模式来预防这些问题。
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「data-quality-frameworks」。 Give me a minimal Great Expectations suite for orders data.
預期結果:
- 定义必需的列和主键检查
- 验证状态值和金额范围
- 添加时效性和行数检查
正在使用「data-quality-frameworks」。 How do I test relationships between tables in dbt?
預期結果:
- 使用关系测试进行外键验证
- 检查模型之间的引用完整性
- 验证 customer_id 映射到 dim_customers
正在使用「data-quality-frameworks」。 Create a data contract for customer data.
預期結果:
- 指定包含必需字段和可选字段的架构
- 为敏感列定义 PII 分类
- 设置时效性 SLA 和质量检查阈值
安全審計
安全This skill is pure documentation containing educational examples for data quality frameworks. All 69 static findings are FALSE POSITIVES. The scanner incorrectly flagged Great Expectations library method names (e.g., 'expect_column_values_to_not_be_null') as shell backtick execution and weak cryptographic algorithms. The content has no executable code, network calls, file access, or sensitive operations.
風險因素
⚙️ 外部命令 (28)
品質評分
你能建構什麼
构建验证套件
为仓库表创建 Great Expectations 套件和检查点。
扩展 dbt 测试
为 marts 添加架构、列和自定义 dbt 测试。
定义数据契约
指定带有架构、质量检查和 SLA 的契约。
試試這些提示
为 orders 表创建一个基本的 Great Expectations 套件,包含主键、状态、金额和 created_at 检查。
为 fct_orders 和 dim_customers 起草 dbt 测试,包括时效性、关系和可接受值。
为 orders 数据集编写数据契约大纲,包含架构、质量检查和 SLA。
描述一个自动化数据质量管道,它为多个表运行套件并生成报告。
最佳實務
- 从关键列开始,逐步扩展测试
- 为每个数据集记录期望和所有权
- 对失败进行告警并定期审查趋势
避免
- 不加优先级地测试每一列
- 无理由地硬编码阈值
- 跳过事件数据的时效性检查
常見問題
这与 Claude 和 Codex 兼容吗?
数据集大小有限制吗?
它可以与 CI 或编排工具集成吗?
它会访问或存储敏感数据吗?
如果检查意外失败怎么办?
这与完整的框架设置相比如何?
開發者詳情
作者
wshobson授權
MIT
儲存庫
https://github.com/wshobson/agents/tree/main/plugins/data-engineering/skills/data-quality-frameworks引用
main
檔案結構
📄 SKILL.md