Compétences wap-ingestion
📦

wap-ingestion

Sûr 🌐 Accès réseau⚙️ Commandes externes⚡ Contient des scripts

S3-Daten mit Write-Audit-Publish-Muster erfassen

Daten sicher von S3 laden, indem sie zunächst in einem temporären Branch gestaffelt werden. Qualität vor dem Zusammenführen in die Produktion überprüfen. Verhindert, dass fehlerhafte Daten Ihre Haupttabellen erreichen.

Prend en charge: Claude Codex Code(CC)
📊 71 Adéquat
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "wap-ingestion". Parquet-Dateien von s3://analytics-data/user-events/ in eine Tabelle namens user_events erfassen

Résultat attendu:

  • Created branch: alice.wap_user_events_1704067200
  • Imported 15,234 rows from S3
  • Quality check passed: 15,234 rows imported
  • Branch ready for inspection
  • To merge: client.merge_branch(source_ref='alice.wap_user_events_1704067200', into_branch='main')

Utilisation de "wap-ingestion". CSV-Daten importieren und automatisch in main zusammenführen

Résultat attendu:

  • Created branch: bob.wap_orders_1704153600
  • Imported 5,000 rows from S3
  • Quality check passed: 5,000 rows imported
  • Successfully published orders to main
  • Cleaned up branch: bob.wap_orders_1704153600

Utilisation de "wap-ingestion". Daten zur Überprüfung vor dem Zusammenführen laden

Résultat attendu:

  • Created branch: carol.wap_products_1704240000
  • Imported 2,500 rows from S3
  • Quality check passed: 2,500 rows imported
  • WAP completed successfully. Branch 'carol.wap_products_1704240000' ready for inspection.
  • Run bauplan checkout main && bauplan branch merge carol.wap_products_1704240000 after review

Audit de sécurité

Sûr
v5 • 1/16/2026

Legitimate data ingestion skill implementing the Write-Audit-Publish pattern. All 47 static findings are FALSE POSITIVES. The 'C2 keywords' detection was triggered by a git tree hash (hex string), 'weak crypto' by generic string patterns, and 'shell backtick' by markdown code formatting. The code uses only the bauplan SDK with hardcoded method names and no command injection vectors.

3
Fichiers analysés
477
Lignes analysées
3
résultats
5
Total des audits

Facteurs de risque

🌐 Accès réseau (2)
⚙️ Commandes externes (1)
⚡ Contient des scripts (1)

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
31
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Sicheres Produktionsdatenladen

Neue Datenchargen mit automatischer Qualitätsverifikation laden, bevor sie downstream Systemen ausgesetzt werden.

Staffelte Datenaktualisierungen

Forschungsdaten in temporären Branch importieren zur Überprüfung, bevor sie in die Haupttabellen für Analysen zusammengeführt werden.

Modell-Feature-Erfassung

Neue Featurendaten sicher von S3-Buckets mit Prüfungen laden, bevor sie in der Produktion verwendet werden.

Essayez ces prompts

Basis-S3-Erfassung
Use wap-ingestion to load data from s3://my-bucket/events/*.parquet into a table called events in the bauplan namespace.
Automatisches Zusammenführen nach Import
Use wap-ingestion to import customer_data.csv from s3://data-bucket/exports/ into the customers table with on_success=merge.
Neue Datencharge anfügen
Use wap-ingestion to append new monthly data from s3://bucket/2024-12/*.parquet to the existing sales table.
Manuelle Überprüfung vor dem Zusammenführen
Use wap-ingestion to load data from s3://bucket/new-data/ into the products table with on_success=inspect so I can review before merging.

Bonnes pratiques

  • Verwenden Sie on_success='inspect' für initiale Datenladungen, um Schema und Inhalt vor dem Zusammenführen zu verifizieren
  • Behalten Sie on_failure='keep', um Branches bei fehlgeschlagenen Imports für das Debugging zu erhalten
  • Überprüfen Sie Branch-Änderungen mit bauplan-Queries vor dem Zusammenführen, um Datenqualitätsprobleme frühzeitig zu erkennen

Éviter

  • Verwenden Sie WAP nicht zum Überschreiben vorhandener Tabellen - es hängt nur an oder erstellt neue Tabellen
  • Überspringen Sie nicht die Prüfungsphase - die Zeilenanzahlprüfung erkennt leere Importe
  • Führen Sie nicht mehrere WAP-Operationen gleichzeitig auf demselben Tabellennamen aus

Foire aux questions

Welche Dateiformate werden unterstützt?
Parquet, CSV und JSONL-Dateien von S3 werden unterstützt. Das Schema wird automatisch aus den Quelldateien abgeleitet.
Was passiert, wenn der Import fehlschlägt?
Bei Fehler wird der Branch standardmäßig zur Inspektion aufbewahrt. Setzen Sie on_failure='delete', um fehlgeschlagene Branches automatisch zu bereinigen.
Kann ich vorhandene Tabellen ändern?
WAP kann neue Zeilen an vorhandene Tabellen anhängen, kann aber Tabellenschemata oder vorhandene Daten nicht ändern.
Sind meine Daten während der Erfassung sicher?
Ja. Daten werden zunächst in einem isolierten temporären Branch geschrieben. Sie erreichen main erst, nachdem Qualitätsprüfungen bestanden wurden und das Zusammenführen ausgeführt wird.
Wie gehe ich mit sehr großen Datensätzen um?
Große Importe werden unterstützt. Die Qualitätsprüfung zählt die Zeilen, um erfolgreichen Import zu verifizieren. Erwägen Sie die Partitionierung von S3-Pfaden für bessere Leistung.
Wie unterscheidet sich dies von direkten Importen?
WAP bietet ein Sicherheitsnetz, indem Daten zunächst auf einem Branch bereitgestellt werden. Fehlerhafte Importe erreichen die Produktion nicht, es sei denn, Sie führen explizit ein Zusammenführen durch.

Détails du développeur

Structure de fichiers