技能 incident-response-incident-response
🚨

incident-response-incident-response

安全

تنسيق سير عمل الاستجابة للحوادث

توفر هذه المهارة سير عمل منظم متعدد المراحل للاستجابة للحوادث لوكلاء الذكاء الاصطناعي، مما يمكّن من الكشف السريع والتحقيق والحل وتوثيق ما بعد الحادث وفقًا لمبادئ SRE الحديثة.

支持: Claude Codex Code(CC)
⚠️ 65
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“incident-response-incident-response”。 Use incident-response skill to triage: API service returning 500 errors for 30% of requests

预期结果:

Severity: P1/SEV-2 (Major degradation)

Affected Services: API Gateway, User Service
User Impact: 30% failed requests, primarily authenticated users

Initial Mitigation:
1. Enable circuit breaker for User Service
2. Check for recent deployments to roll back
3. Scale up API Gateway capacity

Incident Commander: [Assign]
Technical Lead: [Assign]
Communications Lead: [Assign]

正在使用“incident-response-incident-response”。 Use incident-response skill to create postmortem for yesterday's database outage

预期结果:

## Blameless Postmortem - Database Outage

### Timeline
- 14:00 - Alert fired: Database CPU at 99%
- 14:05 - Incident declared P1
- 14:15 - Rollback attempted
- 14:30 - Root cause: Connection pool exhaustion
- 14:45 - Fix deployed
- 15:00 - Incident resolved

### Root Cause
Migration script created 10x normal connections

### What Went Well
- Fast detection (2 min)
- Clear communication

### Action Items
1. Add connection pool monitoring - Owner: Jane - Due: Feb 28
2. Update runbook for migrations - Owner: Bob - Due: Mar 1

安全审计

安全
v1 • 2/25/2026

All 11 static findings are false positives. The skill is a legitimate incident response workflow guide (markdown documentation). The 'external_commands' detection refers to markdown backticks for file paths, not shell execution. The 'weak cryptographic algorithm' and 'system/network reconnaissance' detections are scanner misinterpretations of incident response terminology (severity levels, observability analysis, root cause analysis). No actual security risks present.

1
已扫描文件
171
分析行数
3
发现项
1
审计总数

高风险问题 (3)

External Commands Detection (False Positive)
Scanner detected 'Ruby/shell backtick execution' at SKILL.md:23 - this is markdown formatting (backticks around file path 'resources/implementation-playbook.md'), not shell execution.
Weak Cryptographic Algorithm Detection (False Positive)
Scanner detected 'weak cryptographic algorithm' at multiple lines - these are false positives. The skill contains no cryptographic code.
System/Network Reconnaissance Detection (False Positive)
Scanner detected 'system/network reconnaissance' at multiple lines - these are false positives. The terms refer to legitimate incident response activities (severity classification, observability analysis, root cause analysis).
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
21
社区
75
安全
91
规范符合性

你能构建什么

قائد فريق SRE يدير توقفًا إنتاجيًا

استخدم سير العمل الكامل لتنسيق استجابة الفريق، والحفاظ على هيكل قيادة الحادث، وضمان التواصل السليم خلال حادث sev-1.

مهندس DevOps يجري مراجعة ما بعد الحادث

استخدم المرحلة 5 (ما بعد الحادث والوقاية) لتوثيق الجدول الزمني للحادث، وتحديد الأسباب الجذرية، وإنشاء عناصر عمل لتحسينات المراقبة.

مهندس عند الاتصال يجري التصنيف الأولي

استخدم المرحلة 1 (الكشف والتصنيف) لتصنيف شدة الحادث بسرعة، وتقييم التأثير، وتحديد خطوات التخفيف الأولية.

试试这些提示

التصنيف الأولي للحادث
Use the incident-response skill to triage this alert: [DESCRIBE ALERT]. Determine severity level (P0-P3), identify affected services, assess user impact, and recommend initial mitigation actions.
طلب تحقيق متعمق
Use the incident-response skill to investigate this incident: [INCIDENT DESCRIPTION]. Conduct deep debugging, security assessment, and performance analysis to identify root cause.
تنسيق النشر الطارئ
Use the incident-response skill to coordinate this emergency fix: [INCIDENT AND FIX DESCRIPTION]. Execute deployment with validation, monitoring, and rollback readiness.
إنشاء ما بعد الحادث
Use the incident-response skill to conduct a blameless postmortem for: [INCIDENT SUMMARY]. Document timeline, root cause, what went well, what could improve, and create action items.

最佳实践

  • تعيين قائد حادث واضح وأدوار في غضون أول 5 دقائق من أي حادث P0/P1
  • تحديث تواصل أصحاب المصلحة كل 15-30 دقيقة خلال الحوادث النشطة
  • إكمال ما بعد الحادث بدون لوم في غضون 48 ساعة مع عناصر عمل محددة وقابلة للتعيين

避免

  • تخطي تصنيف الشدة والانتقال مباشرة إلى التصحيح دون فهم التأثير
  • لوم الأفراد في تقارير ما بعد الحادث بدلاً من التركيز على تحسينات النظام
  • تأخير التواصل مع أصحاب المصلحة حتى يتم الحل الكامل

常见问题

هل تنفذ هذه المهارة إجراءات استجابة حوادث فعلية؟
لا. توفر هذه المهارة توجيهات سير عمل وتنسق مهارات متخصصة أخرى. لا تصل مباشرة لأنظمة المراقبة، أو تنشر عمليات، أو تعدل البنية التحتية.
هل يمكن لهذه المهارة استبدال منصة إدارة الحوادث الخاصة بي؟
لا. صُممت هذه المهارة للعمل مع أدوات موجودة مثل PagerDuty وOpsgenie وصفحات الحالة. توفر منطق سير العمل ولكنها تعتمد على أنظمة خارجية للتنبيه والتواصل.
ما مستويات الشدة التي تدعمها هذه المهارة؟
تدعم المهارة مستويات شدة P0 (SEV-1) إلى P3 (SEV-4). تتطلب P0/P1 استجابة فورية من الجميع، بينما تتبع P2/P3 إجراءات الاستجابة القياسية.
كيف تتعامل هذه المهارة مع حوادث الأمان؟
تتضمن المرحلة 2 خطوة تقييم أمان تتحقق من مؤشرات DDoS، وإخفاقات المصادقة، ومخاطر تعريض البيانات، وأنماط الوصول المشبوهة.
هل يمكن للمهندسين المبتدئين استخدام هذه المهارة بفعالية؟
نعم. يوجه سير العمل المنظم أعضاء الفريق الأقل خبرة خلال مراحل الاستجابة للحوادث مع مطالبات واضحة ومخرجات متوقعة لكل خطوة.
ما الذي يجعل هذه المهارة مختلفة عن أدلة التصحيح العامة؟
توفر هذه المهارة نظام قيادة حوادث شامل (ICS) مع تنسيق متعدد الوكلاء، مع التركيز على التنسيق والتواصل والوقاية بدلاً من مجرد حل المشاكل التقنية.