技能 data-engineering-data-driven-feature
📊

data-engineering-data-driven-feature

安全

Datengesteuerte Features mit A/B-Tests entwickeln

Dieser Skill bietet einen umfassenden Workflow für die Entwicklung von Features, die durch datenbasierte Erkenntnisse, A/B-Tests und kontinuierliche Messung gesteuert werden, unter Verwendung spezialisierter KI-Agenten für Analyse, Implementierung und Experimentierung.

支持: Claude Codex Code(CC)
🥉 72 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“data-engineering-data-driven-feature”。 Start data-driven feature for a new checkout flow optimization

预期结果:

Workflow-Plan: (1) EDA-Phase - aktuellen Konversions-Trichter analysieren, (2) Hypothese - 'Vereinfachter Checkout erhöht die Konversion um 5%', (3) Experiment-Design - 2-wöchiger Test, 10% Traffic, primäre Metrik: Checkout-Abschlussrate, (4) Analytics - track checkout_start, checkout_step_complete, checkout_abandon, (5) Architektur - LaunchDarkly Feature Flag, schrittweiser Rollout beginnend bei 5%

正在使用“data-engineering-data-driven-feature”。 Design experiment for recommendation algorithm change

预期结果:

Statistisches Design: Erforderliche Stichprobengröße 50.000 Nutzer pro Variante für 80% Power, um 2% Verbesserung zu erkennen. Primäre Metrik: Klickrate, Guardrail-Metriken: Latenz, Fehlerrate. Randomisierung: user_id-Hash. Analyse: zweiseitiger t-Test mit Bonferroni-Korrektur für multiple Metriken.

安全审计

安全
v1 • 2/24/2026

All 16 static findings are false positives. The skill is a legitimate data engineering workflow orchestrating specialized agents for data analysis, hypothesis development, A/B testing, and statistical analysis. No external commands, cryptographic algorithms, or malicious code patterns are present.

1
已扫描文件
185
分析行数
2
发现项
1
审计总数

高风险问题 (1)

Weak Cryptographic Algorithm Detection (False Positive)
Static scanner incorrectly flagged 'Bayesian', 'LaunchDarkly', 'Snowflake', 'BigQuery', and similar terms as weak cryptographic algorithms. These are legitimate statistical methods (Bayesian statistics) and cloud services (feature flags, data warehouses). No cryptographic code exists in this file.
中风险问题 (1)
External Command Execution Detection (False Positive)
Static scanner detected backticks and flagged as shell command execution. These are markdown code fences and inline code references in documentation, not actual shell commands.
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
50
社区
90
安全
91
规范符合性

你能构建什么

Produktmanager plant Experimente

Produktmanager verwenden diesen Workflow, um datengesteuerte Feature-Launches mit korrektem Experiment-Design, Definition von Erfolgsmetriken und statistischer Gründlichkeit zu planen.

Datenwissenschaftler strukturiert Analyse

Datenwissenschaftler folgen diesem Workflow, um A/B-Tests zu strukturieren, Hypothesen mit ICE- oder RICE-Scoring zu definieren und korrekte statistische Analysen durchzuführen.

Ingenieur implementiert Feature Flags

Backend-Ingenieure verwenden diesen Workflow, um Feature Flags zu implementieren, schrittweise Rollouts zu konfigurieren und von Anfang an eine korrekte Analytics-Instrumentierung einzurichten.

试试这些提示

Datengesteuertes Feature starten
Use the data-engineering-data-driven-feature skill to help me plan a new feature. The feature is: [describe your feature idea]. I want to validate it with A/B testing and measure its impact on [key business metric].
Experiment entwerfen
I need to design an A/B test for [feature name]. Help me create a statistical experiment design including sample size calculation, success metrics, and guardrail metrics. Target metric is [metric], expected improvement is [percentage].
Analytics-Instrumentierung planen
Help me design comprehensive analytics instrumentation for [feature]. I need to track user interactions including [list events]. Recommend event schemas and properties for segmentation in [Amplitude/Mixpanel/Segment].
Testergebnisse analysieren
Our A/B test for [feature] has completed with [sample size] users over [time period]. Treatment showed [results]. Help me perform statistical analysis, calculate significance, and assess business impact.

最佳实践

  • Erfolgsmetriken und Guardrail-Metriken vor Beginn der Entwicklung definieren, um p-Hacking zu vermeiden
  • Schrittweise Rollouts bei 5-10% Traffic beginnen und Fehlerraten überwachen, bevor sie erhöht werden
  • Experimente für vollständige wöchentliche Zyklen durchführen, um Wochentagseffekte zu berücksichtigen
  • Alle Entscheidungen und Erkenntnisse für zukünftige Feature-Entwicklungszyklen dokumentieren

避免

  • Experimente ohne vorab definierte Erfolgskriterien durchführen und Entscheidungen ad-hoc treffen
  • Mit vollem Traffic-Rollout beginnen anstatt schrittweisem Rollout, was weitverbreitete Probleme riskiert
  • Guardrail-Metriken ignorieren und Änderungen deployen, die die Benutzererfahrung verschlechtern
  • Experimente vorzeitig beenden, wenn Ergebnisse vielversprechend aussehen, ohne korrekte statistische Power

常见问题

Welche KI-Tools unterstützen diesen Skill?
Dieser Skill funktioniert mit Claude, Codex und Claude Code. Er bietet Prompts und Workflows, die diese KI-Tools ausführen, um bei datengesteuerter Entwicklung zu helfen.
Benötige ich externe Analytics-Plattformen?
Ja, dieser Skill empfiehlt Plattformen wie Amplitude, Mixpanel, Segment, LaunchDarkly oder Split.io. Diese müssen separat in Ihrer Infrastruktur konfiguriert werden.
Kann dieser Skill meine tatsächlichen Daten analysieren?
Nein, dieser Skill generiert Anleitungen, Prompts und Pläne. Er hat keinen Zugriff auf Ihre Datensysteme. Sie müssen die generierten Pläne mit Ihrem Datenteam ausführen.
Wie lange sollte ich einen A/B-Test laufen lassen?
Tests sollten mindestens einen vollständigen wöchentlichen Zyklus (7 Tage) laufen, um Wochentags-Variationen zu berücksichtigen. Die meisten Experimente laufen 1-4 Wochen, abhängig von der erforderlichen Stichprobengröße.
Welche statistischen Methoden werden verwendet?
Der Skill unterstützt sowohl frequentistische (t-Tests, Chi-Quadrat) als auch Bayesianische Ansätze. Bayesianische Methoden können schnellere Entscheidungsfindung mit probabilistischen Interpretationen bieten.
Ist dies für ML-Modell-A/B-Tests geeignet?
Ja, Phase 9 umfasst ML-Modell-Integration einschließlich Online-Inferenz, A/B-Testing zwischen Modellversionen, Performance-Tracking und Drift-Erkennung.