debugging-toolkit-smart-debug
Depurar problemas de produção com análise de causa raiz assistida por IA
Reduza o tempo médio de resolução de incidentes de produção combinando fluxos de depuração sistemáticos com reconhecimento de padrões alimentado por IA. Obtenha geração estruturada de hipóteses, correlação de dados de observabilidade e recomendações de correção validadas.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“debugging-toolkit-smart-debug”。 Erros de timeout no checkout afetando 5% do tráfego de produção, intermitente
预期结果:
- Resumo do Problema: Timeouts de processamento de pagamento ocorrendo em 5% das requisições de checkout
- Hipótese Principal (75%): Padrão de consulta N+1 na verificação do método de pagamento - suportado por análise de rastreamento mostrando 15+ chamadas sequenciais ao banco de dados
- Estratégia de Depuração: Adicionar atributos de span para contagem de consultas e ID do método de pagamento, implantar canary em 10% do tráfego
- Validação: Comparar percentis de latência e contagens de consultas entre grupos de controle e canary
正在使用“debugging-toolkit-smart-debug”。 Vazamento de memória suspeito no processador de jobs em background
预期结果:
- Resumo do Problema: Crescimento gradual de memória nos pods do processador de jobs, reinicialização necessária a cada 6 horas
- Hipótese Principal (60%): Crescimento de cache ilimitado sem política de evicção
- Estratégia de Depuração: Habilitar profiling de heap com Pyroscope, capturar snapshots de heap em intervalos
- Validação: Monitorar tendências de memória RSS após implementar limites de tamanho de cache
安全审计
安全All static analysis findings were determined to be false positives. The flagged patterns are markdown syntax (backticks for inline code), YAML frontmatter, and documentation examples - not executable code. Line 23 uses backticks for file path reference in markdown. Lines 147-184 contain TypeScript documentation examples illustrating the debugging workflow. No actual command execution, cryptographic operations, or network reconnaissance code exists in this skill.
质量评分
你能构建什么
Triagem de incidentes de produção
Analisar rapidamente alertas de produção recebidos, correlacionar erros entre serviços e gerar hipóteses iniciais para engenheiros de plantão investigarem
Investigação de bugs intermitentes
Aplicar técnicas de depuração estatística para identificar padrões em falhas que afetam pequena porcentagem de usuários ou requisições
Análise de causa raiz pós-mortem
Reconstruir caminhos de execução, identificar fatores contribuintes e gerar recomendações de prevenção para documentação de incidentes
试试这些提示
Analise este erro e identifique a causa raiz mais provável: [cole a mensagem de erro ou rastreamento de pilha]. Inclua o componente afetado e a primeira etapa de depuração recomendada.
Gere 3-5 hipóteses classificadas para este problema: [descreva os sintomas]. Para cada hipótese, forneça pontuação de probabilidade, evidências de suporte necessárias e como falsificá-la.
Projete consultas para investigar [problema específico] em [liste plataformas: Sentry, DataDog, logs]. Inclua filtros específicos, intervalos de tempo e chaves de correlação para identificar usuários e padrões afetados.
Crie um plano de depuração para [problema] que possa ser executado em produção sem impactar usuários. Inclua pontos de instrumentação, design de feature flags, estratégia de amostragem e critérios de rollback.
最佳实践
- Sempre correlacione erros com linhas do tempo de implantação para identificar mudanças recentes como causas potenciais
- Use instrumentação condicional e feature flags para habilitar logging de depuração para coortes específicas de usuários sem impactar o desempenho geral do sistema
- Documente o processo completo de teste de hipóteses, incluindo hipóteses falsificadas, para evitar que investigadores futuros repitam os mesmos caminhos
避免
- Adicionar logging excessivo sem amostragem ou limitação de taxa, causando picos de volume de logs que obscurecem o sinal
- Tentar reproduzir problemas complexos de produção em desenvolvimento sem primeiro coletar dados suficientes de observabilidade
- Implementar correções sem estabelecer critérios claros de sucesso e planos de rollback antes da implantação
常见问题
Quais plataformas de observabilidade esta skill suporta?
Esta skill pode acessar diretamente meus sistemas de produção?
Como lidar com dados sensíveis em logs de erro durante a depuração?
E se as hipóteses geradas por IA estiverem todas incorretas?
Como saber quando escalonar em vez de continuar a investigação?
Esta skill pode ajudar com prevenção após a correção ser implantada?
开发者详情
作者
sickn33许可证
MIT
仓库
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/debugging-toolkit-smart-debug引用
main
文件结构
📄 SKILL.md