Great Expectations、dbt テスト、データ契約を使用した包括的な検証により、信頼性の高いデータパイプラインを実現。データインシデントを削減し、本番対応の品質パターンでアナリティクスへの信頼を構築します。
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "data-quality-frameworks". Slack アラート付きの日次 orders 検証のための Great Expectations チェックポイントを生成
Résultat attendu:
- 日次検証スケジュールで設定されたチェックポイント
- アクション:結果の保存、Data Docs の更新、障害時に Slack 送信
- SLACK_WEBHOOK 環境変数を使用した Webhook 統合
- 実行:context.run_checkpoint(checkpoint_name='orders_checkpoint')
Utilisation de "data-quality-frameworks". PII 処理を含むユーザーイベントのデータ契約を作成
Résultat attendu:
- 契約は user_id(UUID、必須、一意)を定義
- email フィールドは間接的分類で PII としてマーク
- 品質チェック:row_count > 0、duplicate_count = 0
- SLA:99.9% 可用性、1 時間鮮度、5 分レイテンシ
Audit de sécurité
SûrThis is a documentation-only skill providing markdown guides for data quality frameworks. All static analysis findings are false positives: code blocks are markdown examples not executable code, URLs are documentation references, and pattern matches on SQL terms are not actual system calls.
Score de qualité
Ce que vous pouvez construire
dbt テストを構築するアナリティクスエンジニア
カラムレベルの検証、リレーションシップチェック、カスタムビジネスマルを含む dbt モデルのための包括的なテストスイートを作成します。
契約を確立するデータプラットフォームチーム
明確なスキーマエクスペクテーション、品質 SLA、所有権を持つデータプロデューサーとコンシューマー間のデータ契約を定義します。
Great Expectations を実装するデータ品質リード
エクスペクテーションスイート、チェックポイント、自動レポートダッシュボードを備えたエンタープライズグレードのデータ品質検証を導入します。
Essayez ces prompts
order_id を主キーとする orders テーブルの Great Expectations スイートを作成してください。not null、unique、有効な注文ステータス値(pending、processing、shipped、delivered、cancelled)のエクスペクテーションを含めてください。
customer 次元テーブルの dbt schema.yml テスト設定を生成してください。customer_id の unique および not_null テスト、status の accepted_values、参照整合性を検証する relationship テストを含めてください。
E コマースプラットフォームからストリーミングされる注文イベントのデータ契約を設計してください。タイプ付きのスキーマフィールド、PII 分類、SodaCL 構文を使用した品質チェック、鮮度と可用性の SLA 定義を含めてください。
注文合計が一貫していることを検証するカスタム dbt テストを記述してください:subtotal + tax + shipping が 0.01 の許容誤差内で total_amount と一致する必要があります。完全なマクロと使用例を含めてください。
Bonnes pratiques
- パイプラインの早期でテスト - 変換前にソースデータを検証して取り込み時に問題を捕捉
- 重要なカラムに注力 - 網羅的なカバレッジではなく影響度の高いフィールドを優先
- 各エクスペクテーションに明確な説明を文書化し、チームメンバーがビジネスマルを理解できるようにする
Éviter
- フォールバックなしで本番パイプラインをブロック - 重要なデータフローには常に手動オーバーライドパスを確保
- 分離してテスト - 個々のカラム制約だけでなく、テーブル間のリレーションシップも検証
- 閾値をハードコーディング - データ成長に適応する動的ベースラインと統計的範囲を使用
Foire aux questions
Great Expectations と dbt テストの違いは何ですか?
検証出力で PII データをどのように処理すればよいですか?
データ品質チェックが失敗した場合、どうすればよいですか?
データ契約のバージョニングはどのように行いますか?
CI/CD パイプラインで Great Expectations を実行できますか?
データ品質のためにどのようなメトリクスを追跡すべきですか?
Détails du développeur
Auteur
sickn33Licence
MIT
Dépôt
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/data-quality-frameworksRéf
main
Structure de fichiers