스킬 error-diagnostics-error-analysis

📦

error-diagnostics-error-analysis

Name: error-diagnostics-error-analysis
Author: sickn33

안전

프로덕션 오류 진단

이 스킬은 체계적인 디버깅 기법, 분산 트레이싱 분석, 포괄적인 관측 가능성 패턴을 사용하여 개발자가 프로덕션 오류를 신속하게 진단하고 해결할 수 있도록 지원합니다.

지원: Claude Codex Code(CC)

📊 70 적절함

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"error-diagnostics-error-analysis" 사용 중입니다. Error: Database connection timeout after 30s in order-service

예상 결과:

분석: 연결 풀 고갈 감지됨
근본 원인: 장시간 실행되는 쿼리가 모든 연결을 점유 중
권장 수정사항: 쿼리 타임아웃 구현 및 N+1 패턴 최적화
예방: 서킷 브레이커 및 연결 풀 모니터링 추가

"error-diagnostics-error-analysis" 사용 중입니다. Intermittent 502 errors in API gateway

예상 결과:

패턴: 피크 트래픽 시간대에 오류 발생
상관관계: 어제 새 오토스케일링 정책 배포됨
근본 원인: 백엔드 서비스 확장 속도가 부하 분산장치보다 느림
권장사항: 스케일링 매개변수 조정 및 헬스체크 검증 추가

보안 감사

안전

v1 • 2/24/2026

After evaluating 108 static findings, all detections are false positives. The scanner misinterpreted markdown documentation patterns as security issues: backticks in code blocks were flagged as shell execution, example URLs were flagged as network exfiltration, and environment variable reads in example error-tracking code were flagged as credential access. The sensitive data deletion code (lines 751-752) is a security best practice that removes cookies/authorization headers before sending error reports. This is a legitimate error diagnostics skill providing observability documentation.

스캔된 파일

1,194

분석된 줄 수

발견 사항

총 감사 수

보안 문제를 찾지 못했습니다

감사자: claude

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

100

보안

사양 준수

만들 수 있는 것

프로덕션 인시던트 조사

프로덕션 오류를 분석하고 배포와 상관관계를 파악하며, 분산 트레이싱 및 로그 분석을 사용하여 근본 원인을 식별합니다.

애플리케이션 오류 디버깅

스택 트레이스를 검토하고 오류 패턴을 식별하며 애플리케이션 수준의 오류에 대한 수정을 구현합니다.

시스템 관측 가능성 개선

더 나은 인시던트 감지를 위한 포괄적인 오류 추적, 모니터링 및 알람 솔루션을 설계하고 구현합니다.

이 프롬프트를 사용해 보세요

기본 오류 분석

이 오류 메시지와 스택 트레이스를 분석하세요. 가능한 원인을 식별하고 수정 방법을 제안하세요: $ERROR_MESSAGE

분산 시스템 디버깅

이 분산 시스템 오류를 디버깅하세요. $SERVICE_NAME 서비스에서 trace ID $TRACE_ID 로 오류가 발생했습니다. 분산 트레이스를 검토하여 어느 업스트림 서비스가 실패를 유발했는지 식별하세요.

사후 인시던트 검토

이 장애에 대한 사후 인시던트 검토를 수행하세요. 오류 패턴: $ERROR_PATTERN. 타임라인: $TIMELINE. 기여 요인은 무엇이며 어떤 예방 조치를 권장하십니까?

관측 가능성 구현

Node.js/Express 애플리케이션을 위한 관측 가능성 구현을 설계하세요. Sentry 를 통한 오류 추적 설정, OpenTelemetry 를 통한 분산 트레이싱, 중요 오류에 대한 알람 규칙을 포함하세요.

모범 사례

오류를 항상 배포, 설정 변경 및 외부 이벤트와 상관관계 분석
분산 트레이싱을 위한 상관관계 ID 와 구조화된 로깅 구현
일시적 장애를 위한 지수 백오프 리트로직 생성
사용자 영향에 기반한 오류 예산 및 알람 임계값 설정

피하기

간헐적 오류 무시 - 종종 시스템적 문제를 나타냄
컨텍스트별 복구 없이 제네릭 오류 처리 구현
민감 정보를 제거하지 않고 외부 시스템에 원본 오류 데이터 전송
알람 임계값을 너무 낮게 설정하여 알람 피로 유발

자주 묻는 질문

효과적인 오류 분석을 위해 어떤 정보를 제공해야 합니까?

효과적인 오류 분석을 위해 전체 오류 메시지, 완전한 스택 트레이스, 타임스탬프, 영향을 받은 서비스 이름, 최근 배포 기록 및 관련 로그 발췌를 제공하세요.

분산 시스템에서 오류를 어떻게 디버깅합니까?

상관관계 ID 를 사용하여 서비스 간 요청을 추적하고, 분산 트레이싱 데이터를 검토하며, 실패 지점을 식별하고, 역으로 추적하여 근본 원인을 찾으세요.

이 스킬은 어떤 관측 가능성 도구를 지원합니까?

이 스킬은 Sentry, DataDog, OpenTelemetry, Prometheus, Grafana, Jaeger 및 기타 주요 관측 가능성 플랫폼을 다룹니다.

이 스킬이 오류 추적 구현을 도와줄 수 있습니까?

네, 이 구현 플레이북에는 Sentry, DataDog 및 기타 오류 추적 SDK 통합을 위한 코드 샘플이 포함되어 있습니다.

수정을 위해 오류의 우선순위를 어떻게 정합니까?

사용자 영향, 오류 빈도, 심각도, 그리고 오류가 시스템적 문제인지 단일 지점 장애인지를 기준으로 우선순위를 정하세요.

권장되는 오류 처리 전략은 무엇입니까?

다중 방어 전략을 구현하세요: 백오프 리트로직, 서킷 브레이커, 적절한 오류 전파, 포괄적인 로깅 및 자동화된 알람.

개발자 세부 정보

작성자

sickn33

라이선스

MIT

리포지토리

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/error-diagnostics-error-analysis

참조

main

파일 구조

📁 resources/

📄 implementation-playbook.md

📄 SKILL.md