Compétences data-quality-frameworks
📦

data-quality-frameworks

Sûr

検証フレームワークを使用したデータ品質パイプラインの構築

Également disponible depuis: wshobson

Great Expectations、dbt テスト、データ契約を使用した包括的な検証により、信頼性の高いデータパイプラインを実現。データインシデントを削減し、本番対応の品質パターンでアナリティクスへの信頼を構築します。

Prend en charge: Claude Codex Code(CC)
🥉 75 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "data-quality-frameworks". Slack アラート付きの日次 orders 検証のための Great Expectations チェックポイントを生成

Résultat attendu:

  • 日次検証スケジュールで設定されたチェックポイント
  • アクション:結果の保存、Data Docs の更新、障害時に Slack 送信
  • SLACK_WEBHOOK 環境変数を使用した Webhook 統合
  • 実行:context.run_checkpoint(checkpoint_name='orders_checkpoint')

Utilisation de "data-quality-frameworks". PII 処理を含むユーザーイベントのデータ契約を作成

Résultat attendu:

  • 契約は user_id(UUID、必須、一意)を定義
  • email フィールドは間接的分類で PII としてマーク
  • 品質チェック:row_count > 0、duplicate_count = 0
  • SLA:99.9% 可用性、1 時間鮮度、5 分レイテンシ

Audit de sécurité

Sûr
v1 • 2/24/2026

This is a documentation-only skill providing markdown guides for data quality frameworks. All static analysis findings are false positives: code blocks are markdown examples not executable code, URLs are documentation references, and pattern matches on SQL terms are not actual system calls.

2
Fichiers analysés
617
Lignes analysées
0
résultats
1
Total des audits
Aucun problème de sécurité trouvé
Audité par: claude

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
100
Sécurité
100
Conformité aux spécifications

Ce que vous pouvez construire

dbt テストを構築するアナリティクスエンジニア

カラムレベルの検証、リレーションシップチェック、カスタムビジネスマルを含む dbt モデルのための包括的なテストスイートを作成します。

契約を確立するデータプラットフォームチーム

明確なスキーマエクスペクテーション、品質 SLA、所有権を持つデータプロデューサーとコンシューマー間のデータ契約を定義します。

Great Expectations を実装するデータ品質リード

エクスペクテーションスイート、チェックポイント、自動レポートダッシュボードを備えたエンタープライズグレードのデータ品質検証を導入します。

Essayez ces prompts

基本カラム検証
order_id を主キーとする orders テーブルの Great Expectations スイートを作成してください。not null、unique、有効な注文ステータス値(pending、processing、shipped、delivered、cancelled)のエクスペクテーションを含めてください。
dbt テスト設定
customer 次元テーブルの dbt schema.yml テスト設定を生成してください。customer_id の unique および not_null テスト、status の accepted_values、参照整合性を検証する relationship テストを含めてください。
データ契約仕様
E コマースプラットフォームからストリーミングされる注文イベントのデータ契約を設計してください。タイプ付きのスキーマフィールド、PII 分類、SodaCL 構文を使用した品質チェック、鮮度と可用性の SLA 定義を含めてください。
カスタムビジネスマルテスト
注文合計が一貫していることを検証するカスタム dbt テストを記述してください:subtotal + tax + shipping が 0.01 の許容誤差内で total_amount と一致する必要があります。完全なマクロと使用例を含めてください。

Bonnes pratiques

  • パイプラインの早期でテスト - 変換前にソースデータを検証して取り込み時に問題を捕捉
  • 重要なカラムに注力 - 網羅的なカバレッジではなく影響度の高いフィールドを優先
  • 各エクスペクテーションに明確な説明を文書化し、チームメンバーがビジネスマルを理解できるようにする

Éviter

  • フォールバックなしで本番パイプラインをブロック - 重要なデータフローには常に手動オーバーライドパスを確保
  • 分離してテスト - 個々のカラム制約だけでなく、テーブル間のリレーションシップも検証
  • 閾値をハードコーディング - データ成長に適応する動的ベースラインと統計的範囲を使用

Foire aux questions

Great Expectations と dbt テストの違いは何ですか?
Great Expectations は詳細な検証レポートと Data Docs を備えた豊富なエクスペクテーションスイートを提供します。dbt テストは SQL ベースで dbt ビルドプロセスの一部として実行されます。両方を使用してください:dbt は変換時のチェック、Great Expectations はより深い検証用。
検証出力で PII データをどのように処理すればよいですか?
検証結果やレポートに生の PII 値を含めないでください。集計、マスキング、または行数と統計要約のみをレポートしてください。データ契約で PII フィールドをマークし、追加のアクセス制御を適用します。
データ品質チェックが失敗した場合、どうすればよいですか?
まず、データの問題かテストの問題かを確認してください。データ所有者に通知し、ブロッキングの場合は影響を受けたデータを検疫し、インシデントを文書化してください。障害をテストの改善に活用し、再発を防止します。
データ契約のバージョニングはどのように行いますか?
契約をコードとして扱ってください:git に保存し、セマンティックバージョニングを使用し、変更ログを維持します。破壊的変更の場合はメジャーバージョンをインクリメントし、コンシューマーにマイグレーションガイダンスを提供します。
CI/CD パイプラインで Great Expectations を実行できますか?
はい。CI で軽量エクスペクテーションスイートを実行し、スキーマ変更と重要な違反を捕捉します。デプロイの遅延を避けるために、包括的なスイートは別にスケジュールしてください。
データ品質のためにどのようなメトリクスを追跡すべきですか?
スイート別のパスレート、障害検出までの平均時間、解決までの平均時間、経時トレンド分析を追跡してください。鮮度、完全性、有効性の各ディメンションを個別に監視します。

Détails du développeur

Structure de fichiers