incident-response-incident-response
인시던트 대응 워크플로우 오케스트레이션
이 스킬은 AI 에이전트를 위한 구조화된 다단계 인시던트 대응 워크플로우를 제공하여 최신 SRE 원칙에 따라 신속한 탐지, 조사, 해결 및 사후 검토 문서화를 가능하게 합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"incident-response-incident-response" 사용 중입니다. incident-response 스킬을 사용하여 트리아지: API 서비스가 30%의 요청에 대해 500 오류 반환
예상 결과:
심각도: P1/SEV-2 (주요 성능 저하)
영향 받는 서비스: API Gateway, User Service
사용자 영향: 30% 실패한 요청, 주로 인증된 사용자
초기 완화:
1. User Service용 서킷 브레이커 활성화
2. 최근 배포 확인 후 롤백
3. API Gateway 용량 확장
인시던트 커맨더: [지정]
기술 리드: [지정]
커뮤니케이션 리드: [지정]
"incident-response-incident-response" 사용 중입니다. incident-response 스킬을 사용하여 어제 데이터베이스 장애에 대한 사후 검토 생성
예상 결과:
## 비난 없는 사후 검토 - 데이터베이스 장애
### 타임라인
- 14:00 - 알림 발생: 데이터베이스 CPU 99%
- 14:05 - P1 인시던트 선언
- 14:15 - 롤백 시도
- 14:30 - 근본 원인: 커넥션 풀 고갈
- 14:45 - 수정 배포
- 15:00 - 인시던트 해결
### 근본 원인
마이그레이션 스크립트가 평소보다 10배 많은 연결 생성
### 잘된 점
- 신속한 탐지(2분)
- 명확한 커뮤니케이션
### 실행 항목
1. 커넥션 풀 모니터링 추가 - 담당자: Jane - 마감: 2월 28일
2. 마이그레이션용 런북 업데이트 - 담당자: Bob - 마감: 3월 1일
보안 감사
안전All 11 static findings are false positives. The skill is a legitimate incident response workflow guide (markdown documentation). The 'external_commands' detection refers to markdown backticks for file paths, not shell execution. The 'weak cryptographic algorithm' and 'system/network reconnaissance' detections are scanner misinterpretations of incident response terminology (severity levels, observability analysis, root cause analysis). No actual security risks present.
높은 위험 문제 (3)
품질 점수
만들 수 있는 것
프로덕션 장애를 관리하는 SRE 팀 리드
전체 워크플로우를 사용하여 팀 대응을 조정하고, SEV-1 인시던트 중 인시던트 커맨드 구조를 유지하며 적절한 커뮤니케이션을 보장합니다.
인시던트 사후 검토를 수행하는 DevOps 엔지니어
5단계(사후 검토 및 예방)를 사용하여 인시던트 타임라인을 문서화하고, 근본 원인을 파악하며, 모니터링 개선을 위한 실행 항목을 생성합니다.
초기 트리아지를 수행하는 온콜 엔지니어
1단계(탐지 및 트리아지)를 사용하여 인��던트 심각도를 신속하게 분류하고, 영향을 평가하며, 초기 완화 단계를 결정합니다.
이 프롬프트를 사용해 보세요
incident-response 스킬을 사용하여 이 알림을 트리아지하세요: [알림 설명]. 심각도 수준(P0-P3)을 결정하고, 영향을 받는 서���스를 식별하며, 사용자 영향을 평가하고 초기 완화 작업을 추천하세요.
incident-response 스킬을 사용하여 이 인시던트를 조사하세요: [인시던트 설명]. 근본 원인을 파악하기 위해 심층 디버깅, 보안 평가 및 성능 분석을 수행하세요.
incident-response 스킬을 사용하여 이 비상 수정을 조정하세요: [인시던트 및 수정 설명]. 검증, 모니터링 및 롤백 준비 상태를 갖추고 배포를 실행하세요.
incident-response 스킬을 사용하여 다음에 대한 비난 없는 사후 검토를 수행하세요: [인���던트 요약]. 타임라인, 근본 원인, 잘된 점, 개선할 점을 문서화하고 실행 항목을 생성하세요.
모범 사례
- 모든 P0/P1 인시던트 발생 후 5분 이내에 명확한 인시던트 커맨더와 역할 할당
- 활성 인시던트 중 15-30분마다 이해관계자 커뮤니케이션 업데이트
- 구체적이고 할당 가능한 실행 항목과 함께 48시간 이내에 비난 없는 사후 검토 완료
피하기
- 영향을 이해하지 않고 심각도 분류를 건너뛰고 바로 디버깅으로 넘어가기
- 시스템 개선이 아닌 사후 검토에서 개인을 비난하기
- 완전한 해결까지 이해관계자와의 커뮤니케이션 지연하기