slo-implementation
Определение SLO с бюджетами ошибок и оповещениями
Цели надежности часто неясны и их трудно измерить. Этот навык предоставляет шаблоны SLI, SLO и бюджета ошибок с рекомендациями по оповещениям для внедрения практик SRE.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «slo-implementation». Создать план SLO для API сервиса
Ожидаемый результат:
- SLO доступности 99,9 процента за 28 дней
- Соотношение SLI на PromQL для расчета успешных запросов
- Политика бюджета ошибок с действиями при 50, 10 и 0 процентах оставшегося бюджета
- Порог оповещения о быстром сгорании 14,4x за 5-минутное окно
- Порог оповещения о медленном сгорании 6x за 6-часовое окно
Использование «slo-implementation». Как рассчитать бюджет ошибок для SLO 99,5 процента
Ожидаемый результат:
- Бюджет ошибок 0,5 процента = 3,6 часа в месяц
- Формула бюджета ошибок: 1 минус цель SLO
- Отслеживать оставшийся бюджет против фактической частоты ошибок
- Установить пороги оповещений для быстрой и медленной скорости сгорания
Использование «slo-implementation». Какие хорошие цели SLO для клиентского API
Ожидаемый результат:
- SLO доступности 99,9 процента является обычным для API
- SLO задержки p99 менее 500 миллисекунд для большинства эндпоинтов
- Бюджет ошибок 0,1 процента позволяет 43 минуты простоя в месяц
- Рассмотрите более строгие SLO для критических платежных эндпоинтов
Аудит безопасности
БезопасноThis skill contains only documentation and YAML/PromQL templates. No executable code, file system access, network calls, or command execution. All static findings are false positives where markdown code block delimiters were misidentified as shell commands and percentage values as cryptographic algorithms.
Факторы риска
🌐 Доступ к сети (1)
⚙️ Внешние команды (30)
Оценка качества
Что вы можете построить
Установить цели надежности сервиса
Определить SLO и бюджеты ошибок для критических сервисов и согласовать команды по целям надежности.
Добавить оповещения SLO
Создать оповещения о скорости сгорания и правила записи для раннего обнаружения нарушений SLO.
Просмотреть тенденции надежности
Использовать рекомендации по графику проверки SLO для отслеживания целей надежности при выпуске релизов.
Попробуйте эти промпты
Объясните разницу между SLI, SLO и SLA для веб-API и предложите один пример SLI.
Предложите SLO доступности 99,9 процента для API и покажите выражение SLI на PromQL.
Создайте политику бюджета ошибок с действиями при 50, 10 и 0 процентах оставшегося бюджета.
Составьте оповещения о скорости сгорания для нескольких окон для SLO доступности 99,9 процента с использованием правил Prometheus.
Лучшие практики
- Начните с сервисов, обращенных к пользователю, и простых SLI, которые отражают пользовательский опыт
- Используйте оповещения о скорости сгорания для нескольких окон, чтобы уменьшить шум оповещений при обнаружении реальных проблем
- Регулярно проверяйте SLO и корректируйте цели на основе фактической производительности
Избегать
- Установка SLO 100 процентов без бюджета ошибок не оставляет места для инноваций
- Использование только внутренних метрик, которые не отражают реальное влияние на пользователя
- Игнорирование статуса бюджета ошибок при выпуске рискованных изменений вызывает инциденты надежности
Часто задаваемые вопросы
С какими платформами работает этот навык?
Каковы ограничения этого навыка?
Могу ли я интегрировать это с существующим мониторингом?
Имеет ли этот навык доступ к моим данным или хранит их?
Что делать, если мои SLO часто нарушаются?
Как это сравнивается с инструментами SLO от вендоров?
Сведения для разработчиков
Автор
wshobsonЛицензия
MIT
Репозиторий
https://github.com/wshobson/agents/tree/main/plugins/observability-monitoring/skills/slo-implementationСсылка
main
Структура файлов
📄 SKILL.md