Error Detective
Обнаружение и диагностика ошибок в ваших системах
Ошибки в продакшене сложно отследить в распределённых системах. Этот навык анализирует логи, соотносит ошибки и определяет корневые причины для ускорения отладки.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «Error Detective». Файл лога с повторяющимися ошибками NullPointerException
Ожидаемый результат:
Извлечено 47 случаев NullPointerException в период 14:32-14:45 UTC. Пиковая частота: 12 ошибок/минуту в 14:38. Все ошибки исходят из метода UserService.getUser(). Корреляция: ошибки начались через 2 минуты после развёртывания v2.3.1.
Использование «Error Detective». Трассировка стека из сервиса платежей при таймауте
Ожидаемый результат:
Корневая причина: исчерпание пула соединений с базой данных. Доказательства: таймаут в ConnectionPool.getConnection (строка 142), перед которым было 200+ ожидающих запросов. Исправление: увеличить размер пула с 10 до 50 соединений и добавить circuit breaker.
Аудит безопасности
БезопасноThis is a prompt-only skill with no executable code, network access, or filesystem operations. Static analysis scanned 0 files and detected no security patterns. The skill provides guidance for log analysis and error investigation without any attack vectors.
Оценка качества
Что вы можете построить
Расследование продакшен-инцидентов
Анализ логов ошибок при продакшен-сбое для определения корневой причины и хронологии отказов в микросервисах.
Отладка периодических сбоев
Корреляция спорадических ошибок в логах приложений для обнаружения паттернов и условий, вызывающих периодические баги.
Постмортем-анализ
Обзор исторических данных об ошибках после инцидента для понимания цепочек сбоев и рекомендаций по предотвращению.
Попробуйте эти промпты
Проанализируйте этот фрагмент лога и извлеките все сообщения об ошибках с их временными метками. Сгруппируйте похожие ошибки и определите наиболее частый тип ошибки.
Изучите эту трассировку стека и определите корневую причину сбоя. Объясните, какой путь кода вызвал ошибку, и предложите исправления.
У меня есть логи от трёх микросервисов во время сбоя. Соотнесите ошибки по временной метке и определите, какой сервис отказал первым и вызвал каскад.
Сгенерируйте запросы Elasticsearch и Splunk для обнаружения этого специфического паттерна ошибок в продакшене. Включите пороги оповещения для скачков частоты ошибок.
Лучшие практики
- Всегда включайте временные метки и ID корреляции при предоставлении образцов логов для анализа
- Предоставляйте логи всех затронутых сервисов для точной межсистемной корреляции
- Предоставляйте контекст о недавних развёртываниях или изменениях конфигурации, которые могут быть связаны с ошибками
Избегать
- Не передавайте конфиденциальные данные, такие как API-ключи, пароли или персональная информация в логах
- Избегайте анализа изолированных сообщений об ошибках без окружающего контекста лога
- Не предполагайте, что первая видимая ошибка является корневой причиной — прослеживайте цепочку назад