Навыки incident-response-incident-response

🚨

incident-response-incident-response

Name: incident-response-incident-response
Author: sickn33

Безопасно

Оркестрация рабочих процессов реагирования на инциденты

Этот навык предоставляет структурированный многофазный рабочий процесс реагирования на инциденты для AI-агентов, обеспечивая быстрое обнаружение, расследование, устранение и документирование постмортема в соответствии с современными принципами SRE.

Поддерживает: Claude Codex Code(CC)

⚠️ 65 Плохо

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «incident-response-incident-response». Используйте навык incident-response для триажа: API-сервис возвращает 500 ошибки для 30% запросов

Ожидаемый результат:

Уровень серьезности: P1/SEV-2 (Значительная деградация)

Затронутые сервисы: API Gateway, User Service
Влияние на пользователей: 30% неудачных запросов, в основном у аутентифицированных пользователей

Начальное смягчение:
1. Включить circuit breaker для User Service
2. Проверить недавние развертывания для отката
3. Увеличить мощность API Gateway

Командир инцидента: [Назначить]
Технический лид: [Назначить]
Лид по коммуникациям: [Назначить]

Использование «incident-response-incident-response». Используйте навык incident-response для создания постмортема по вчерашнему простою базы данных

Ожидаемый результат:

## Blameless Postmortem — простой базы данных

### Временная шкала
- 14:00 — Сработало оповещение: CPU базы данных на 99%
- 14:05 — Инцидент объявлен P1
- 14:15 — Попытка отката
- 14:30 — Первопричина: исчерпание пула соединений
- 14:45 — Исправление развернуто
- 15:00 — Инцидент устранен

### Первопричина
Скрипт миграции создал в 10 раз больше обычных соединений

### Что прошло хорошо
- Быстрое обнаружение (2 мин)
- Четкая коммуникация

### Задачи
1. Добавить мониторинг пула соединений — Ответственный: Jane — Срок: 28 фев
2. Обновить runbook для миграций — Ответственный: Bob — Срок: 1 мар

Аудит безопасности

Безопасно

v1 • 2/25/2026

All 11 static findings are false positives. The skill is a legitimate incident response workflow guide (markdown documentation). The 'external_commands' detection refers to markdown backticks for file paths, not shell execution. The 'weak cryptographic algorithm' and 'system/network reconnaissance' detections are scanner misinterpretations of incident response terminology (severity levels, observability analysis, root cause analysis). No actual security risks present.

Просканировано файлов

171

Проанализировано строк

находки

Всего аудитов

Проблемы высокого риска (3)

SKILL.md:23

External Commands Detection (False Positive)

Scanner detected 'Ruby/shell backtick execution' at SKILL.md:23 - this is markdown formatting (backticks around file path 'resources/implementation-playbook.md'), not shell execution.

SKILL.md:3 SKILL.md:89 SKILL.md:129 SKILL.md:165

Weak Cryptographic Algorithm Detection (False Positive)

Scanner detected 'weak cryptographic algorithm' at multiple lines - these are false positives. The skill contains no cryptographic code.

SKILL.md:25 SKILL.md:32 SKILL.md:33 SKILL.md:55 SKILL.md:89 SKILL.md:96

System/Network Reconnaissance Detection (False Positive)

Scanner detected 'system/network reconnaissance' at multiple lines - these are false positives. The terms refer to legitimate incident response activities (severity classification, observability analysis, root cause analysis).

Проверено: claude

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

Безопасность

Соответствие спецификации

Что вы можете построить

Ведущий SRE-инженер управляет простоем на проде

Используйте полный рабочий процесс для координации ответа команды, поддержания структуры управления инцидентами и обеспечения надлежащей коммуникации во время инцидента уровня sev-1.

DevOps-инженер проводит пост-инцидентный анализ

Используйте Фазу 5 (Постмортем и предотвращение) для документирования временной шкалы инцидента, выявления первопричин и создания задач для улучшения мониторинга.

Дежурный инженер выполняет первоначальную триаж

Используйте Фазу 1 (Обнаружение и триаж) для быстрой классификации уровня серьезности инцидента, оценки воздействия и определения начальных шагов по смягчению.

Попробуйте эти промпты

Первоначальный триаж инцидента

Используйте навык incident-response для триажа этого оповещения: [ОПИСАНИЕ ОПОВЕЩЕНИЯ]. Определите уровень серьезности (P0-P3), выявите затронутые сервисы, оцените влияние на пользователей и порекомендуйте начальные действия по смягчению.

Запрос на глубокое расследование

Используйте навык incident-response для расследования этого инцидента: [ОПИСАНИЕ ИНЦИДЕНТА]. Проведите глубокую отладку, оценку безопасности и анализ производительности для выявления первопричины.

Координация экстренного развертывания

Используйте навык incident-response для координации этого экстренного исправления: [ОПИСАНИЕ ИНЦИДЕНТА И ИСПРАВЛЕНИЯ]. Выполните развертывание с валидацией, мониторингом и готовностью к откату.

Генерация постмортема

Используйте навык incident-response для проведения blameless-постмортема для: [СВОДКА ИНЦИДЕНТА]. Задокументируйте временную шкалу, первопричину, что прошло хорошо, что можно улучшить, и создайте задачи.

Лучшие практики

Назначьте четкого командира инцидента и роли в течение первых 5 минут любого инцидента P0/P1
Обновляйте коммуникацию с заинтересованными сторонами каждые 15-30 минут во время активных инцидентов
Завершайте blameless-постмортем в течение 48 часов с конкретными, назначаемыми задачами

Избегать

Пропуск классификации серьезности и переход сразу к отладке без понимания воздействия
Обвинение отдельных людей в постмортемах вместо фокуса на улучшениях системы
Задержка коммуникации с заинтересованными сторонами до полного устранения инцидента

Часто задаваемые вопросы

Выполняет ли этот навык фактические действия по реагированию на инциденты?

Нет. Этот навык предоставляет руководство по рабочему процессу и оркестрирует другие специализированные навыки. Он не получает прямого доступа к системам мониторинга, не выполняет развертывания и не модифицирует инфраструктуру.

Может ли этот навык заменить мою платформу управления инцидентами?

Нет. Этот навык разработан для работы с существующими инструментами, такими как PagerDuty, Opsgenie и страницы статуса. Он предоставляет логику рабочего процесса, но полагается на внешние системы для оповещений и коммуникации.

Какие уровни серьезности поддерживает этот навык?

Навык поддерживает уровни серьезности от P0 (SEV-1) до P3 (SEV-4). P0/P1 требуют немедленного ответа всех участников, в то время как P2/P3 следуют стандартным процедурам реагирования.

Как этот навык обрабатывает инциденты безопасности?

Фаза 2 включает шаг оценки безопасности, который проверяет индикаторы DDoS, сбои аутентификации, риски раскрытия данных и подозрительные шаблоны доступа.

Могут ли младшие инженеры эффективно использовать этот навык?

Да. Структурированный рабочий процесс направляет менее опытных участников команды через фазы реагирования на инциденты с четкими подсказками и ожидаемыми результатами для каждого шага.

Чем этот навык отличается от общих руководств по отладке?

Этот навык предоставляет комплексную систему управления инцидентами (ICS) с оркестрацией нескольких агентов, фокусируясь на координации, коммуникации и предотвращении, а не только на технической отладке.

Сведения для разработчиков

Автор

sickn33

Лицензия

MIT

Репозиторий

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/incident-response-incident-response

Ссылка

main

Структура файлов

📄 SKILL.md