技能 error-diagnostics-error-analysis
📦

error-diagnostics-error-analysis

安全

프로덕션 오류 진단

이 스킬은 체계적인 디버깅 기법, 분산 트레이싱 분석, 포괄적인 관측 가능성 패턴을 사용하여 개발자가 프로덕션 오류를 신속하게 진단하고 해결할 수 있도록 지원합니다.

支持: Claude Codex Code(CC)
🥉 74 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“error-diagnostics-error-analysis”。 Error: Database connection timeout after 30s in order-service

预期结果:

  • 분석: 연결 풀 고갈 감지됨
  • 근본 원인: 장시간 실행되는 쿼리가 모든 연결을 점유 중
  • 권장 수정사항: 쿼리 타임아웃 구현 및 N+1 패턴 최적화
  • 예방: 서킷 브레이커 및 연결 풀 모니터링 추가

正在使用“error-diagnostics-error-analysis”。 Intermittent 502 errors in API gateway

预期结果:

  • 패턴: 피크 트래픽 시간대에 오류 발생
  • 상관관계: 어제 새 오토스케일링 정책 배포됨
  • 근본 원인: 백엔드 서비스 확장 속도가 부하 분산장치보다 느림
  • 권장사항: 스케일링 매개변수 조정 및 헬스체크 검증 추가

安全审计

安全
v1 • 2/24/2026

After evaluating 108 static findings, all detections are false positives. The scanner misinterpreted markdown documentation patterns as security issues: backticks in code blocks were flagged as shell execution, example URLs were flagged as network exfiltration, and environment variable reads in example error-tracking code were flagged as credential access. The sensitive data deletion code (lines 751-752) is a security best practice that removes cookies/authorization headers before sending error reports. This is a legitimate error diagnostics skill providing observability documentation.

2
已扫描文件
1,194
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
50
社区
100
安全
91
规范符合性

你能构建什么

프로덕션 인시던트 조사

프로덕션 오류를 분석하고 배포와 상관관계를 파악하며, 분산 트레이싱 및 로그 분석을 사용하여 근본 원인을 식별합니다.

애플리케이션 오류 디버깅

스택 트레이스를 검토하고 오류 패턴을 식별하며 애플리케이션 수준의 오류에 대한 수정을 구현합니다.

시스템 관측 가능성 개선

더 나은 인시던트 감지를 위한 포괄적인 오류 추적, 모니터링 및 알람 솔루션을 설계하고 구현합니다.

试试这些提示

기본 오류 분석
이 오류 메시지와 스택 트레이스를 분석하세요. 가능한 원인을 식별하고 수정 방법을 제안하세요: $ERROR_MESSAGE
분산 시스템 디버깅
이 분산 시스템 오류를 디버깅하세요. $SERVICE_NAME 서비스에서 trace ID $TRACE_ID 로 오류가 발생했습니다. 분산 트레이스를 검토하여 어느 업스트림 서비스가 실패를 유발했는지 식별하세요.
사후 인시던트 검토
이 장애에 대한 사후 인시던트 검토를 수행하세요. 오류 패턴: $ERROR_PATTERN. 타임라인: $TIMELINE. 기여 요인은 무엇이며 어떤 예방 조치를 권장하십니까?
관측 가능성 구현
Node.js/Express 애플리케이션을 위한 관측 가능성 구현을 설계하세요. Sentry 를 통한 오류 추적 설정, OpenTelemetry 를 통한 분산 트레이싱, 중요 오류에 대한 알람 규칙을 포함하세요.

最佳实践

  • 오류를 항상 배포, 설정 변경 및 외부 이벤트와 상관관계 분석
  • 분산 트레이싱을 위한 상관관계 ID 와 구조화된 로깅 구현
  • 일시적 장애를 위한 지수 백오프 리트로직 생성
  • 사용자 영향에 기반한 오류 예산 및 알람 임계값 설정

避免

  • 간헐적 오류 무시 - 종종 시스템적 문제를 나타냄
  • 컨텍스트별 복구 없이 제네릭 오류 처리 구현
  • 민감 정보를 제거하지 않고 외부 시스템에 원본 오류 데이터 전송
  • 알람 임계값을 너무 낮게 설정하여 알람 피로 유발

常见问题

효과적인 오류 분석을 위해 어떤 정보를 제공해야 합니까?
효과적인 오류 분석을 위해 전체 오류 메시지, 완전한 스택 트레이스, 타임스탬프, 영향을 받은 서비스 이름, 최근 배포 기록 및 관련 로그 발췌를 제공하세요.
분산 시스템에서 오류를 어떻게 디버깅합니까?
상관관계 ID 를 사용하여 서비스 간 요청을 추적하고, 분산 트레이싱 데이터를 검토하며, 실패 지점을 식별하고, 역으로 추적하여 근본 원인을 찾으세요.
이 스킬은 어떤 관측 가능성 도구를 지원합니까?
이 스킬은 Sentry, DataDog, OpenTelemetry, Prometheus, Grafana, Jaeger 및 기타 주요 관측 가능성 플랫폼을 다룹니다.
이 스킬이 오류 추적 구현을 도와줄 수 있습니까?
네, 이 구현 플레이북에는 Sentry, DataDog 및 기타 오류 추적 SDK 통합을 위한 코드 샘플이 포함되어 있습니다.
수정을 위해 오류의 우선순위를 어떻게 정합니까?
사용자 영향, 오류 빈도, 심각도, 그리고 오류가 시스템적 문제인지 단일 지점 장애인지를 기준으로 우선순위를 정하세요.
권장되는 오류 처리 전략은 무엇입니까?
다중 방어 전략을 구현하세요: 백오프 리트로직, 서킷 브레이커, 적절한 오류 전파, 포괄적인 로깅 및 자동화된 알람.