error-diagnostics-error-analysis
프로덕션 오류 진단
이 스킬은 체계적인 디버깅 기법, 분산 트레이싱 분석, 포괄적인 관측 가능성 패턴을 사용하여 개발자가 프로덕션 오류를 신속하게 진단하고 해결할 수 있도록 지원합니다.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“error-diagnostics-error-analysis”。 Error: Database connection timeout after 30s in order-service
预期结果:
- 분석: 연결 풀 고갈 감지됨
- 근본 원인: 장시간 실행되는 쿼리가 모든 연결을 점유 중
- 권장 수정사항: 쿼리 타임아웃 구현 및 N+1 패턴 최적화
- 예방: 서킷 브레이커 및 연결 풀 모니터링 추가
正在使用“error-diagnostics-error-analysis”。 Intermittent 502 errors in API gateway
预期结果:
- 패턴: 피크 트래픽 시간대에 오류 발생
- 상관관계: 어제 새 오토스케일링 정책 배포됨
- 근본 원인: 백엔드 서비스 확장 속도가 부하 분산장치보다 느림
- 권장사항: 스케일링 매개변수 조정 및 헬스체크 검증 추가
安全审计
安全After evaluating 108 static findings, all detections are false positives. The scanner misinterpreted markdown documentation patterns as security issues: backticks in code blocks were flagged as shell execution, example URLs were flagged as network exfiltration, and environment variable reads in example error-tracking code were flagged as credential access. The sensitive data deletion code (lines 751-752) is a security best practice that removes cookies/authorization headers before sending error reports. This is a legitimate error diagnostics skill providing observability documentation.
质量评分
你能构建什么
프로덕션 인시던트 조사
프로덕션 오류를 분석하고 배포와 상관관계를 파악하며, 분산 트레이싱 및 로그 분석을 사용하여 근본 원인을 식별합니다.
애플리케이션 오류 디버깅
스택 트레이스를 검토하고 오류 패턴을 식별하며 애플리케이션 수준의 오류에 대한 수정을 구현합니다.
시스템 관측 가능성 개선
더 나은 인시던트 감지를 위한 포괄적인 오류 추적, 모니터링 및 알람 솔루션을 설계하고 구현합니다.
试试这些提示
이 오류 메시지와 스택 트레이스를 분석하세요. 가능한 원인을 식별하고 수정 방법을 제안하세요: $ERROR_MESSAGE
이 분산 시스템 오류를 디버깅하세요. $SERVICE_NAME 서비스에서 trace ID $TRACE_ID 로 오류가 발생했습니다. 분산 트레이스를 검토하여 어느 업스트림 서비스가 실패를 유발했는지 식별하세요.
이 장애에 대한 사후 인시던트 검토를 수행하세요. 오류 패턴: $ERROR_PATTERN. 타임라인: $TIMELINE. 기여 요인은 무엇이며 어떤 예방 조치를 권장하십니까?
Node.js/Express 애플리케이션을 위한 관측 가능성 구현을 설계하세요. Sentry 를 통한 오류 추적 설정, OpenTelemetry 를 통한 분산 트레이싱, 중요 오류에 대한 알람 규칙을 포함하세요.
最佳实践
- 오류를 항상 배포, 설정 변경 및 외부 이벤트와 상관관계 분석
- 분산 트레이싱을 위한 상관관계 ID 와 구조화된 로깅 구현
- 일시적 장애를 위한 지수 백오프 리트로직 생성
- 사용자 영향에 기반한 오류 예산 및 알람 임계값 설정
避免
- 간헐적 오류 무시 - 종종 시스템적 문제를 나타냄
- 컨텍스트별 복구 없이 제네릭 오류 처리 구현
- 민감 정보를 제거하지 않고 외부 시스템에 원본 오류 데이터 전송
- 알람 임계값을 너무 낮게 설정하여 알람 피로 유발