Habilidades error-diagnostics-error-analysis

📦

error-diagnostics-error-analysis

Name: error-diagnostics-error-analysis
Author: sickn33

Seguro

Diagnosticar Erros de Produção

Esta habilidade ajuda desenvolvedores a diagnosticarem e resolverem rapidamente erros de produção usando técnicas sistemáticas de debugging, análise de rastreamento distribuído e padrões abrangentes de observabilidade.

Suporta: Claude Codex Code(CC)

📊 70 Adequado

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "error-diagnostics-error-analysis". Error: Database connection timeout after 30s in order-service

Resultado esperado:

Analysis: Connection pool exhaustion detected
Root cause: Long-running queries holding all connections
Recommended fix: Implement query timeout and optimize N+1 patterns
Prevention: Add circuit breaker and connection pool monitoring

A utilizar "error-diagnostics-error-analysis". Intermittent 502 errors in API gateway

Resultado esperado:

Pattern: Errors occur during peak traffic windows
Correlation: New autoscaling policy deployed yesterday
Root cause: Backend services scaling slower than load balancer
Recommendation: Adjust scaling parameters and add health check validation

Auditoria de Segurança

Seguro

v1 • 2/24/2026

After evaluating 108 static findings, all detections are false positives. The scanner misinterpreted markdown documentation patterns as security issues: backticks in code blocks were flagged as shell execution, example URLs were flagged as network exfiltration, and environment variable reads in example error-tracking code were flagged as credential access. The sensitive data deletion code (lines 751-752) is a security best practice that removes cookies/authorization headers before sending error reports. This is a legitimate error diagnostics skill providing observability documentation.

Arquivos analisados

1,194

Linhas analisadas

achados

Total de auditorias

Nenhum problema de segurança encontrado

Auditado por: claude

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Investigar Incidentes de Produção

Analisar erros de produção, correlacionar com deploys e identificar causa raiz usando rastreamento distribuído e análise de logs.

Depurar Erros de Aplicação

Examinar stack traces, identificar padrões de erro e implementar correções para erros de nível de aplicação.

Melhorar Observabilidade do Sistema

Desenhar e implementar soluções abrangentes de rastreamento de erros, monitoramento e alertas para melhor detecção de incidentes.

Tente Estes Prompts

Análise de Erro Básica

Analyze this error message and stack trace. Identify the likely cause and suggest a fix: $ERROR_MESSAGE

Debugging de Sistema Distribuído

Debug this distributed system error. The error occurred in service $SERVICE_NAME with trace ID $TRACE_ID. Examine the distributed trace and identify which upstream service caused the failure.

Revisão Pós-Incidente

Conduct a post-incident review for this outage. Error pattern: $ERROR_PATTERN. Timeline: $TIMELINE. What were the contributing factors and what preventive measures would you recommend?

Implementação de Observabilidade

Design an observability implementation for a Node.js/Express application. Include error tracking setup with Sentry, distributed tracing with OpenTelemetry, and alerting rules for critical errors.

Melhores Práticas

Sempre correlacione erros com deploys, mudanças de configuração e eventos externos
Implemente logging estruturado com IDs de correlação para rastreamento distribuído
Crie lógica de retry com backoff exponencial para falhas transitórias
Estabeleça orçamentos de erro e limiares de alerta baseados no impacto do usuário

Evitar

Ignorar erros intermitentes - eles frequentemente indicam problemas sistêmicos
Implementar tratamento de erro genérico sem recuperação específica por contexto
Enviar dados de erro brutos para sistemas externos sem remover informações sensíveis
Definir limiares de alerta muito baixos, causando fadiga de alertas

Perguntas Frequentes

Que informações devo fornecer para uma análise de erro eficaz?

Forneça a mensagem de erro completa, stack trace completo, timestamps, nomes dos serviços afetados, histórico de deploys recentes e quaisquer trechos de logs relevantes.

Como faço para depurar erros em um sistema distribuído?

Use IDs de correlação para rastrear requisições entre serviços, examine dados de rastreamento distribuído, identifique o ponto de falha e trace retroativamente para encontrar a causa raiz.

Quais ferramentas de observabilidade esta habilidade suporta?

A habilidade cobre Sentry, DataDog, OpenTelemetry, Prometheus, Grafana, Jaeger e outras plataformas importantes de observabilidade.

Esta habilidade pode ajudar a implementar rastreamento de erros?

Sim, o playbook de implementação inclui exemplos de código para integração com Sentry, DataDog e outros SDKs de rastreamento de erros.

Como priorizo erros para correção?

Prioritize por impacto no usuário, frequência do erro, severidade e se o erro indica um problema sistêmico ou falha pontual.

Qual é a estratégia recomendada de tratamento de erros?

Implemente defesa em profundidade: lógica de retry com backoff, circuit breakers, propagação de erro adequada, logging abrangente e alertas automatizados.

Detalhes do Desenvolvedor

Autor

sickn33

Licença

MIT

Repositório

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/error-diagnostics-error-analysis

Referência

main

Estrutura de arquivos

📁 resources/

📄 implementation-playbook.md

📄 SKILL.md