Habilidades error-diagnostics-error-analysis
📦

error-diagnostics-error-analysis

Seguro

Diagnosticar Erros de Produção

Esta habilidade ajuda desenvolvedores a diagnosticarem e resolverem rapidamente erros de produção usando técnicas sistemáticas de debugging, análise de rastreamento distribuído e padrões abrangentes de observabilidade.

Suporta: Claude Codex Code(CC)
🥉 74 Bronze
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "error-diagnostics-error-analysis". Error: Database connection timeout after 30s in order-service

Resultado esperado:

  • Analysis: Connection pool exhaustion detected
  • Root cause: Long-running queries holding all connections
  • Recommended fix: Implement query timeout and optimize N+1 patterns
  • Prevention: Add circuit breaker and connection pool monitoring

A utilizar "error-diagnostics-error-analysis". Intermittent 502 errors in API gateway

Resultado esperado:

  • Pattern: Errors occur during peak traffic windows
  • Correlation: New autoscaling policy deployed yesterday
  • Root cause: Backend services scaling slower than load balancer
  • Recommendation: Adjust scaling parameters and add health check validation

Auditoria de Segurança

Seguro
v1 • 2/24/2026

After evaluating 108 static findings, all detections are false positives. The scanner misinterpreted markdown documentation patterns as security issues: backticks in code blocks were flagged as shell execution, example URLs were flagged as network exfiltration, and environment variable reads in example error-tracking code were flagged as credential access. The sensitive data deletion code (lines 751-752) is a security best practice that removes cookies/authorization headers before sending error reports. This is a legitimate error diagnostics skill providing observability documentation.

2
Arquivos analisados
1,194
Linhas analisadas
0
achados
1
Total de auditorias
Nenhum problema de segurança encontrado
Auditado por: claude

Pontuação de qualidade

38
Arquitetura
100
Manutenibilidade
87
Conteúdo
50
Comunidade
100
Segurança
91
Conformidade com especificações

O Que Você Pode Construir

Investigar Incidentes de Produção

Analisar erros de produção, correlacionar com deploys e identificar causa raiz usando rastreamento distribuído e análise de logs.

Depurar Erros de Aplicação

Examinar stack traces, identificar padrões de erro e implementar correções para erros de nível de aplicação.

Melhorar Observabilidade do Sistema

Desenhar e implementar soluções abrangentes de rastreamento de erros, monitoramento e alertas para melhor detecção de incidentes.

Tente Estes Prompts

Análise de Erro Básica
Analyze this error message and stack trace. Identify the likely cause and suggest a fix: $ERROR_MESSAGE
Debugging de Sistema Distribuído
Debug this distributed system error. The error occurred in service $SERVICE_NAME with trace ID $TRACE_ID. Examine the distributed trace and identify which upstream service caused the failure.
Revisão Pós-Incidente
Conduct a post-incident review for this outage. Error pattern: $ERROR_PATTERN. Timeline: $TIMELINE. What were the contributing factors and what preventive measures would you recommend?
Implementação de Observabilidade
Design an observability implementation for a Node.js/Express application. Include error tracking setup with Sentry, distributed tracing with OpenTelemetry, and alerting rules for critical errors.

Melhores Práticas

  • Sempre correlacione erros com deploys, mudanças de configuração e eventos externos
  • Implemente logging estruturado com IDs de correlação para rastreamento distribuído
  • Crie lógica de retry com backoff exponencial para falhas transitórias
  • Estabeleça orçamentos de erro e limiares de alerta baseados no impacto do usuário

Evitar

  • Ignorar erros intermitentes - eles frequentemente indicam problemas sistêmicos
  • Implementar tratamento de erro genérico sem recuperação específica por contexto
  • Enviar dados de erro brutos para sistemas externos sem remover informações sensíveis
  • Definir limiares de alerta muito baixos, causando fadiga de alertas

Perguntas Frequentes

Que informações devo fornecer para uma análise de erro eficaz?
Forneça a mensagem de erro completa, stack trace completo, timestamps, nomes dos serviços afetados, histórico de deploys recentes e quaisquer trechos de logs relevantes.
Como faço para depurar erros em um sistema distribuído?
Use IDs de correlação para rastrear requisições entre serviços, examine dados de rastreamento distribuído, identifique o ponto de falha e trace retroativamente para encontrar a causa raiz.
Quais ferramentas de observabilidade esta habilidade suporta?
A habilidade cobre Sentry, DataDog, OpenTelemetry, Prometheus, Grafana, Jaeger e outras plataformas importantes de observabilidade.
Esta habilidade pode ajudar a implementar rastreamento de erros?
Sim, o playbook de implementação inclui exemplos de código para integração com Sentry, DataDog e outros SDKs de rastreamento de erros.
Como priorizo erros para correção?
Prioritize por impacto no usuário, frequência do erro, severidade e se o erro indica um problema sistêmico ou falha pontual.
Qual é a estratégia recomendada de tratamento de erros?
Implemente defesa em profundidade: lógica de retry com backoff, circuit breakers, propagação de erro adequada, logging abrangente e alertas automatizados.

Detalhes do Desenvolvedor

Estrutura de arquivos