observability-monitoring-slo-implement
SLO 및 오류 예산 구현
SLI 및 오류 예산과 함께 서비스 수준 목표를 설계 및 구현하여 시스템 안정성을 측정 및 개선하고, 기능 개발 속도와 균형을 맞추세요.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"observability-monitoring-slo-implement" 사용 중입니다. 새로운 전자상거래 체크아웃 서비스에 대한 SLO 설계
예상 결과:
tier 분류(중요), 가용성 목표(99.95%), 지연 시간 SLI(p95 < 500ms), 오류율 SLI(< 0.1%), 오류 예산 계산(월 4.38시간), 소각率 경고 임계값을 포함한 종합적인 SLO 프레임워크
"observability-monitoring-slo-implement" 사용 중입니다. SLO 추적을 위한 Prometheus 녹화 규칙 생성
예상 결과:
요청율, 다중 시간 창(5분, 30분, 1시간)의 성공율, 지연 시간 백분위수(p50, p95, p99), 오류 예산 소각率 계산을 위한 녹화 규칙이 포함된 YAML 구성
보안 감사
안전Static analysis detected 57 potential issues, but manual review confirms all findings are false positives. The skill contains documentation with Python code examples for SLO implementation - no actual executable code, no network calls, and no cryptographic operations. The placeholder URLs use example.com domain. This is a legitimate DevOps reliability skill.
중간 위험 문제 (2)
낮은 위험 문제 (3)
품질 점수
만들 수 있는 것
새로운 API 서비스에 대한 SLO 정의
서비스 중요도에 따라 적절한 대상을 포함한 가용성, 지연 시간 및 오류율 SLO 생성
오류 예산 경고 설정
빠른 및 느린 오류 예산 소각을 감지하기 위한 다중 창 소각率 경고 구성
SLO 검토 프로세스 수립
엔지니어링 팀을 위한 주간 SLO 검토 템플릿 및 거버넌스 프로세스 생성
이 프롬프트를 사용해 보세요
결제 처리 서비스를 위한 SLO를 설계 도와주세요. 분당 10,000개의 요청을 처리하며 높은 안정성이 필요합니다. 어떤 가용성 목표를 설정해야 하며 SLI를 어떻게 정의해야 하나요?
Prometheus를 사용하는 REST API 서비스에 대한 SLI를 구현해야 합니다. 성공적인 요청의百分比와 500ms 미만의 요청을 추적하는 가용성 및 지연 시간 SLI 쿼리를 생성하는 방법을 보여주세요.
99.9% SLO 대상을 가진 서비스에 대한 오류 예산 소각率 경고를 구성해야 합니다. 빠른 소각(즉시 페이지)과 느린 소각(티켓 생성) 경고 규칙이 모두 필요합니다.
역할 및 책임, 주간 검토 템플릿 및 이해관계자 comunication 프로세스를 포함한 팀을 위한 SLO 거버넌스 프레임워크를 수립해주세요.
모범 사례
- 保守적인 SLO 대상에서 시작하고 실제 서비스 performance 데이터에 따라 강화
- 빠른 및 느린 예산的消费를 감지하기 위해 다중 시간 창 소각率 경고 사용
- 기술적 편의성이 아닌 business 우선순위 및 사용자 기대에 SLO 대상을 맞춤
피하기
- 과도하게tight한 SLO 대상을 처음부터 설정하여 지속적인 경고 및 경고 피로 발생
- 지연 시간 또는 품질 지표를 고려하지 않고 가용성 SLI만 사용
- 이해관계자 조정 또는 business 맥락 없이 SLO 생성