data-quality-frameworks
Crie Pipelines de Qualidade de Dados com Frameworks de Validação
Également disponible depuis: wshobson
Garanta pipelines de dados confiáveis com validação abrangente usando Great Expectations, testes dbt e contratos de dados. Reduza incidentes de dados e construa confiança em suas análises com padrões de qualidade prontos para produção.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "data-quality-frameworks". Generate Great Expectations checkpoint for daily orders validation with Slack alerts
Résultat attendu:
- Checkpoint configurado com agendamento de validação diário
- Ações: armazenar resultados, atualizar Data Docs, enviar Slack em falha
- Integração de webhook usando variável de ambiente SLACK_WEBHOOK
- Executar com: context.run_checkpoint(checkpoint_name='orders_checkpoint')
Utilisation de "data-quality-frameworks". Create data contract for user events with PII handling
Résultat attendu:
- Contrato define user_id (UUID, obrigatório, único)
- Campo email marcado como PII com classificação indireta
- Verificações de qualidade: row_count > 0, duplicate_count = 0
- SLA: 99.9% de disponibilidade, 1 hora de freshness, 5 minutos de latência
Audit de sécurité
SûrThis is a documentation-only skill providing markdown guides for data quality frameworks. All static analysis findings are false positives: code blocks are markdown examples not executable code, URLs are documentation references, and pattern matches on SQL terms are not actual system calls.
Score de qualité
Ce que vous pouvez construire
Engenheiro de Analytics Construindo Testes dbt
Crie suítes de teste abrangentes para seus modelos dbt com validações em nível de coluna, verificações de relacionamento e regras de negócio personalizadas.
Equipe de Plataforma de Dados Estabelecendo Contratos
Defina contratos de dados entre produtores e consumidores de dados com expectativas claras de esquema, SLAs de qualidade e propriedade.
Líder de Qualidade de Dados Implementando Great Expectations
Implmente validação de qualidade de dados de nível empresarial com suítes de expectativas, checkpoints e dashboards automatizados de relatórios.
Essayez ces prompts
Crie uma suíte Great Expectations para uma tabela de pedidos com order_id como chave primária. Inclua expectativas para not null, unique e valores válidos de status do pedido (pending, processing, shipped, delivered, cancelled).
Gere configurações de teste schema.yml dbt para uma tabela de dimensão de cliente. Inclua testes unique e not_null para customer_id, accepted_values para status e um teste de relacionamento para verificar integridade referencial.
Projete um contrato de dados para eventos de pedidos transmitidos de uma plataforma de e-commerce. Inclua campos de esquema com tipos, classificações PII, verificações de qualidade usando sintaxe SodaCL e definições de SLA para freshnes e disponibilidade.
Escreva um teste dbt personalizado que valide que os totais de pedidos são consistentes: subtotal + tax + shipping deve igualar total_amount com tolerância de 0.01. Inclua o macro completo e exemplo de uso.
Bonnes pratiques
- Teste cedo no pipeline - valide dados de origem antes das transformações para detectar problemas na ingestão
- Foque em colunas críticas - priorize campos de alto impacto em vez de cobertura exaustiva
- Documente cada expectativa com descrições claras para que os membros da equipe entendam a regra de negócio
Éviter
- Bloquear pipelines de produção sem fallback - sempre tenha um caminho de substituição manual para fluxos de dados críticos
- Testar em isolamento - valide relacionamentos entre tabelas, não apenas restrições de coluna individuais
- Codificar limites fixos - use linhas de base dinâmicas e intervalos estatísticos que se adaptam ao crescimento dos dados
Foire aux questions
Qual é a diferença entre Great Expectations e testes dbt?
Como lidar com dados PII em saídas de validação?
O que devo fazer quando uma verificação de qualidade de dados falha?
Como fazer versionamento de contratos de dados?
Posso executar Great Expectations no meu pipeline CI/CD?
Quais métricas devo acompanhar para qualidade de dados?
Détails du développeur
Auteur
sickn33Licence
MIT
Dépôt
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/data-quality-frameworksRéf
main
Structure de fichiers