技能 data-engineering-data-driven-feature
📊

data-engineering-data-driven-feature

安全

Construa Recursos Orientados por Dados com Testes A/B

Esta habilidade fornece um fluxo de trabalho abrangente para construir recursos guiados por insights de dados, testes A/B e medição contínua usando agentes de IA especializados para análise, implementação e experimentação.

支持: Claude Codex Code(CC)
🥉 72 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“data-engineering-data-driven-feature”。 Iniciar recurso orientado por dados para uma nova otimização de fluxo de checkout

预期结果:

Plano de fluxo de trabalho: (1) Fase EDA - analisar funnel de conversão atual, (2) Hipótese - 'Checkout simplificado aumentará a conversão em 5%', (3) Design do experimento - teste de 2 semanas, 10% do tráfego, métrica principal: taxa de conclusão de checkout, (4) Analytics - rastrear checkout_start, checkout_step_complete, checkout_abandon, (5) Arquitetura - feature flag LaunchDarkly, rollout gradual começando em 5%

正在使用“data-engineering-data-driven-feature”。 Projetar experimento para mudança no algoritmo de recomendação

预期结果:

Design estatístico: Tamanho amostral necessário de 50.000 usuários por variante para 80% de poder para detectar melhoria de 2%. Métrica principal: taxa de cliques, Métricas de salvaguarda: latência, taxa de erro. Randomização: hash de user_id. Análise: teste t de duas caudas com correção de Bonferroni para múltiplas métricas.

安全审计

安全
v1 • 2/24/2026

All 16 static findings are false positives. The skill is a legitimate data engineering workflow orchestrating specialized agents for data analysis, hypothesis development, A/B testing, and statistical analysis. No external commands, cryptographic algorithms, or malicious code patterns are present.

1
已扫描文件
185
分析行数
2
发现项
1
审计总数

高风险问题 (1)

Weak Cryptographic Algorithm Detection (False Positive)
Static scanner incorrectly flagged 'Bayesian', 'LaunchDarkly', 'Snowflake', 'BigQuery', and similar terms as weak cryptographic algorithms. These are legitimate statistical methods (Bayesian statistics) and cloud services (feature flags, data warehouses). No cryptographic code exists in this file.
中风险问题 (1)
External Command Execution Detection (False Positive)
Static scanner detected backticks and flagged as shell command execution. These are markdown code fences and inline code references in documentation, not actual shell commands.
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
50
社区
90
安全
91
规范符合性

你能构建什么

Gerente de Produto Planejando Experimentos

Gerentes de produto usam este fluxo de trabalho para planejar lançamentos de recursos orientados por dados com design adequado de experimentos, definição de métricas de sucesso e rigor estatístico.

Cientista de Dados Estruturando Análise

Cientistas de dados seguem este fluxo de trabalho para estruturar testes A/B, definir hipóteses com pontuação ICE ou RICE e realizar análise estatística adequada.

Engenheiro Implementando Feature Flags

Engenheiros de backend usam este fluxo de trabalho para implementar feature flags, configurar rollouts graduais e estabelecer instrumentação de analytics adequada desde o início.

试试这些提示

Iniciar Recurso Orientado por Dados
Use a habilidade data-engineering-data-driven-feature para me ajudar a planejar um novo recurso. O recurso é: [descreva sua ideia de recurso]. Quero validá-lo com teste A/B e medir seu impacto em [métrica chave de negócio].
Projetar Experimento
Preciso projetar um teste A/B para [nome do recurso]. Ajude-me a criar um design de experimento estatístico incluindo cálculo de tamanho amostral, métricas de sucesso e métricas de salvaguarda. A métrica alvo é [métrica], a melhoria esperada é [porcentagem].
Planejar Instrumentação de Analytics
Ajude-me a projetar instrumentação de analytics abrangente para [recurso]. Preciso rastrear interações do usuário incluindo [listar eventos]. Recomende schemas de eventos e propriedades para segmentação em [Amplitude/Mixpanel/Segment].
Analisar Resultados de Teste
Nosso teste A/B para [recurso] foi concluído com [tamanho da amostra] usuários durante [período de tempo]. O tratamento mostrou [resultados]. Ajude-me a realizar análise estatística, calcular significância e avaliar impacto de negócio.

最佳实践

  • Defina métricas de sucesso e métricas de salvaguarda antes de iniciar o desenvolvimento para evitar p-hacking
  • Comece rollouts graduais em 5-10% do tráfego e monitore taxas de erro antes de aumentar
  • Execute experimentos por ciclos semanais completos para considerar efeitos do dia da semana
  • Documente todas as decisões e aprendizados para ciclos futuros de desenvolvimento de recursos

避免

  • Executar experimentos sem critérios de sucesso predefinidos e tomar decisões de forma ad-hoc
  • Começar com rollout de tráfego total em vez de rollout gradual arriscando problemas generalizados
  • Ignorar métricas de salvaguarda e implantar mudanças que prejudicam a experiência do usuário
  • Encerrar experimentos precocemente quando os resultados parecem promissores sem poder estatístico adequado

常见问题

Quais ferramentas de IA suportam esta habilidade?
Esta habilidade funciona com Claude, Codex e Claude Code. Ela fornece prompts e fluxos de trabalho que essas ferramentas de IA executam para ajudar com desenvolvimento orientado por dados.
Preciso de plataformas externas de analytics?
Sim, esta habilidade recomenda plataformas como Amplitude, Mixpanel, Segment, LaunchDarkly ou Split.io. Estas devem ser configuradas separadamente em sua infraestrutura.
Esta habilidade pode analisar meus dados reais?
Não, esta habilidade gera orientação, prompts e planos. Não tem acesso aos seus sistemas de dados. Você precisará executar os planos gerados com sua equipe de dados.
Por quanto tempo devo executar um teste A/B?
Os testes devem ser executados por pelo menos um ciclo semanal completo (7 dias) para considerar variação do dia da semana. A maioria dos experimentos dura 1-4 semanas dependendo do tamanho amostral necessário.
Quais métodos estatísticos são usados?
A habilidade suporta abordagens frequentistas (testes t, qui-quadrado) e Bayesianas. Métodos Bayesianos podem fornecer tomada de decisão mais rápida com interpretações probabilísticas.
Isso é adequado para testes A/B de modelos de ML?
Sim, a Fase 9 cobre integração de modelos de ML incluindo inferência online, testes A/B entre versões de modelo, rastreamento de desempenho e detecção de drift.