dbt-transformation-patterns
Construisez des pipelines de transformation de données dbt prêts pour la production
Également disponible depuis: wshobson
Les équipes d'analyse luttent avec des modèles de données incohérents et une documentation médiocre. Cette compétence fournit des modèles éprouvés pour organiser des projets dbt avec des tests appropriés, une documentation et un traitement incrémental.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "dbt-transformation-patterns". Créer un modèle de staging pour la source de paiements Stripe
Résultat attendu:
- YAML de définition de source avec le schéma de table des paiements et les tests
- stg_stripe__payments.sql avec transformation basée sur les CTE
- Renommage des colonnes suivant les conventions de nommage (id en payment_id, amount in cents en dollars)
- Configuration incrémentale avec unique_key et filtre updated_at
Utilisation de "dbt-transformation-patterns". Construire une dimension client avec des métriques de paiement
Résultat attendu:
- dim_customers.sql joignant les modèles intermédiaires de client et de paiement
- Génération de clé substitut en utilisant dbt_utils
- Logique de segmentation de niveau de client basée sur la valeur à vie
- Documentation YAML avec descriptions de colonnes et tests
Audit de sécurité
SûrThis skill is safe for publication. Static analysis detected 70 patterns that are all false positives - the flagged content consists of SQL/YAML code examples in markdown documentation, not executable code. The skill provides reference patterns for dbt (data build tool) analytics engineering workflows.
Score de qualité
Ce que vous pouvez construire
Ingénieur analytique construisant des pipelines de transformation
Configurez un nouveau projet dbt avec une organisation de modèles appropriée, des tests et une documentation dès le premier jour.
Équipe de données améliorant la qualité des modèles
Ajoutez des tests complets, une documentation et une surveillance de la fraîcheur aux modèles dbt existants.
Équipe d'ingénierie optimisant les chargements incrémentaux
Implémentez des stratégies incrémentales efficaces pour les grandes tables de faits afin de réduire les coûts de calcul.
Essayez ces prompts
Créez un modèle de staging dbt pour la table [source_name] [table_name]. Incluez la définition de la source avec les descriptions de colonnes, un modèle SQL de staging avec des conventions de renommage appropriées, et des tests de base pour la clé primaire et les contraintes not-null.
Créez un modèle de table de faits incrémental dbt nommé fct_[name] qui suit [business_process]. Configurez-le pour une matérialisation incrémentale avec [strategy], définissez la unique_key, et incluez la logique de filtre incrémental en utilisant is_incremental().
Examinez ce SQL de modèle dbt et générez le fichier de documentation YAML correspondant. Incluez la description du modèle, les descriptions de colonnes, et les tests appropriés (unique, not_null, relationships, accepted_values) basés sur les colonnes présentes.
Concevez une structure de modèle dbt pour un flux de travail analytique [domain]. Définissez les modèles de staging nécessaires pour [sources], les modèles intermédiaires pour la logique métier, et les modèles de mart (dimensions et faits) pour la sortie finale. Incluez les conventions de nommage et les stratégies de matérialisation pour chaque couche.
Bonnes pratiques
- Utilisez la couche de staging pour toutes les données source - nettoyez une fois, réutilisez partout
- Testez de manière agressive avec des tests not_null, unique et relationship sur toutes les clés
- Documentez chaque modèle et chaque colonne avec le contexte métier pour les utilisateurs en aval
Éviter
- Sauter la couche de staging et interroger directement les sources dans les marts crée de la dette technique
- Coder en dur des dates ou des valeurs au lieu d'utiliser les variables dbt pour la configuration
- Répéter la logique métier à travers les modèles au lieu de l'extraire dans des macros réutilisables
Foire aux questions
Qu'est-ce que l'architecture medallion dans dbt ?
Quand dois-je utiliser la matérialisation incrémentale ?
Quels tests dois-je ajouter à mes modèles ?
Comment choisir entre les stratégies incrémentales delete+insert et merge ?
Quel est l'objectif des modèles éphémères ?
Comment documenter efficacement mon projet dbt ?
Détails du développeur
Auteur
sickn33Licence
MIT
Dépôt
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/dbt-transformation-patternsRéf
main
Structure de fichiers