Навыки incident-response-incident-response
🚨

incident-response-incident-response

Безопасно

Оркестрация рабочих процессов реагирования на инциденты

Этот навык предоставляет структурированный многофазный рабочий процесс реагирования на инциденты для AI-агентов, обеспечивая быстрое обнаружение, расследование, устранение и документирование постмортема в соответствии с современными принципами SRE.

Поддерживает: Claude Codex Code(CC)
⚠️ 67 Плохо
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «incident-response-incident-response». Используйте навык incident-response для триажа: API-сервис возвращает 500 ошибки для 30% запросов

Ожидаемый результат:

Уровень серьезности: P1/SEV-2 (Значительная деградация)

Затронутые сервисы: API Gateway, User Service
Влияние на пользователей: 30% неудачных запросов, в основном у аутентифицированных пользователей

Начальное смягчение:
1. Включить circuit breaker для User Service
2. Проверить недавние развертывания для отката
3. Увеличить мощность API Gateway

Командир инцидента: [Назначить]
Технический лид: [Назначить]
Лид по коммуникациям: [Назначить]

Использование «incident-response-incident-response». Используйте навык incident-response для создания постмортема по вчерашнему простою базы данных

Ожидаемый результат:

## Blameless Postmortem — простой базы данных

### Временная шкала
- 14:00 — Сработало оповещение: CPU базы данных на 99%
- 14:05 — Инцидент объявлен P1
- 14:15 — Попытка отката
- 14:30 — Первопричина: исчерпание пула соединений
- 14:45 — Исправление развернуто
- 15:00 — Инцидент устранен

### Первопричина
Скрипт миграции создал в 10 раз больше обычных соединений

### Что прошло хорошо
- Быстрое обнаружение (2 мин)
- Четкая коммуникация

### Задачи
1. Добавить мониторинг пула соединений — Ответственный: Jane — Срок: 28 фев
2. Обновить runbook для миграций — Ответственный: Bob — Срок: 1 мар

Аудит безопасности

Безопасно
v1 • 2/25/2026

All 11 static findings are false positives. The skill is a legitimate incident response workflow guide (markdown documentation). The 'external_commands' detection refers to markdown backticks for file paths, not shell execution. The 'weak cryptographic algorithm' and 'system/network reconnaissance' detections are scanner misinterpretations of incident response terminology (severity levels, observability analysis, root cause analysis). No actual security risks present.

1
Просканировано файлов
171
Проанализировано строк
3
находки
1
Всего аудитов

Проблемы высокого риска (3)

External Commands Detection (False Positive)
Scanner detected 'Ruby/shell backtick execution' at SKILL.md:23 - this is markdown formatting (backticks around file path 'resources/implementation-playbook.md'), not shell execution.
Weak Cryptographic Algorithm Detection (False Positive)
Scanner detected 'weak cryptographic algorithm' at multiple lines - these are false positives. The skill contains no cryptographic code.
System/Network Reconnaissance Detection (False Positive)
Scanner detected 'system/network reconnaissance' at multiple lines - these are false positives. The terms refer to legitimate incident response activities (severity classification, observability analysis, root cause analysis).
Проверено: claude

Оценка качества

38
Архитектура
100
Сопровождаемость
87
Контент
31
Сообщество
75
Безопасность
91
Соответствие спецификации

Что вы можете построить

Ведущий SRE-инженер управляет простоем на проде

Используйте полный рабочий процесс для координации ответа команды, поддержания структуры управления инцидентами и обеспечения надлежащей коммуникации во время инцидента уровня sev-1.

DevOps-инженер проводит пост-инцидентный анализ

Используйте Фазу 5 (Постмортем и предотвращение) для документирования временной шкалы инцидента, выявления первопричин и создания задач для улучшения мониторинга.

Дежурный инженер выполняет первоначальную триаж

Используйте Фазу 1 (Обнаружение и триаж) для быстрой классификации уровня серьезности инцидента, оценки воздействия и определения начальных шагов по смягчению.

Попробуйте эти промпты

Первоначальный триаж инцидента
Используйте навык incident-response для триажа этого оповещения: [ОПИСАНИЕ ОПОВЕЩЕНИЯ]. Определите уровень серьезности (P0-P3), выявите затронутые сервисы, оцените влияние на пользователей и порекомендуйте начальные действия по смягчению.
Запрос на глубокое расследование
Используйте навык incident-response для расследования этого инцидента: [ОПИСАНИЕ ИНЦИДЕНТА]. Проведите глубокую отладку, оценку безопасности и анализ производительности для выявления первопричины.
Координация экстренного развертывания
Используйте навык incident-response для координации этого экстренного исправления: [ОПИСАНИЕ ИНЦИДЕНТА И ИСПРАВЛЕНИЯ]. Выполните развертывание с валидацией, мониторингом и готовностью к откату.
Генерация постмортема
Используйте навык incident-response для проведения blameless-постмортема для: [СВОДКА ИНЦИДЕНТА]. Задокументируйте временную шкалу, первопричину, что прошло хорошо, что можно улучшить, и создайте задачи.

Лучшие практики

  • Назначьте четкого командира инцидента и роли в течение первых 5 минут любого инцидента P0/P1
  • Обновляйте коммуникацию с заинтересованными сторонами каждые 15-30 минут во время активных инцидентов
  • Завершайте blameless-постмортем в течение 48 часов с конкретными, назначаемыми задачами

Избегать

  • Пропуск классификации серьезности и переход сразу к отладке без понимания воздействия
  • Обвинение отдельных людей в постмортемах вместо фокуса на улучшениях системы
  • Задержка коммуникации с заинтересованными сторонами до полного устранения инцидента

Часто задаваемые вопросы

Выполняет ли этот навык фактические действия по реагированию на инциденты?
Нет. Этот навык предоставляет руководство по рабочему процессу и оркестрирует другие специализированные навыки. Он не получает прямого доступа к системам мониторинга, не выполняет развертывания и не модифицирует инфраструктуру.
Может ли этот навык заменить мою платформу управления инцидентами?
Нет. Этот навык разработан для работы с существующими инструментами, такими как PagerDuty, Opsgenie и страницы статуса. Он предоставляет логику рабочего процесса, но полагается на внешние системы для оповещений и коммуникации.
Какие уровни серьезности поддерживает этот навык?
Навык поддерживает уровни серьезности от P0 (SEV-1) до P3 (SEV-4). P0/P1 требуют немедленного ответа всех участников, в то время как P2/P3 следуют стандартным процедурам реагирования.
Как этот навык обрабатывает инциденты безопасности?
Фаза 2 включает шаг оценки безопасности, который проверяет индикаторы DDoS, сбои аутентификации, риски раскрытия данных и подозрительные шаблоны доступа.
Могут ли младшие инженеры эффективно использовать этот навык?
Да. Структурированный рабочий процесс направляет менее опытных участников команды через фазы реагирования на инциденты с четкими подсказками и ожидаемыми результатами для каждого шага.
Чем этот навык отличается от общих руководств по отладке?
Этот навык предоставляет комплексную систему управления инцидентами (ICS) с оркестрацией нескольких агентов, фокусируясь на координации, коммуникации и предотвращении, а не только на технической отладке.

Сведения для разработчиков

Структура файлов

📄 SKILL.md