slo-implementation
Definir SLOs con presupuestos de errores y alertas
Los objetivos de confiabilidad a menudo no están claros y son difíciles de medir. Esta habilidad proporciona plantillas de SLI, SLO y presupuesto de errores con orientación sobre alertas para implementar prácticas de SRE.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "slo-implementation". Crear un plan de SLO para un servicio de API
Resultado esperado:
- SLO de disponibilidad al 99.9 por ciento durante 28 días
- Proporción SLI de PromQL para cálculo de solicitudes exitosas
- Política de presupuesto de errores con acciones al 50, 10 y 0 por ciento restante
- Umbral de alerta de tasa de quema rápida a 14.4x durante ventana de 5 minutos
- Umbral de alerta de tasa de quema lenta a 6x durante ventana de 6 horas
Usando "slo-implementation". ¿Cómo calculo el presupuesto de errores para un SLO del 99.5 por ciento?
Resultado esperado:
- El presupuesto de errores es del 0.5 por ciento = 3.6 horas por mes
- Fórmula del presupuesto de errores: 1 menos el objetivo SLO
- Seguir el presupuesto restante contra la tasa de error real
- Establecer umbrales de alerta para tasas de quema rápida y lenta
Usando "slo-implementation". ¿Cuáles son buenos objetivos SLO para una API面向 cliente?
Resultado esperado:
- Un SLO de disponibilidad del 99.9 por ciento es común para APIs
- SLO de latencia en p99 bajo 500 milisegundos para la mayoría de endpoints
- Presupuesto de errores del 0.5 por ciento permite 43 minutos de inactividad por mes
- Considerar SLOs más estrictos para endpoints críticos de pago
Auditoría de seguridad
SeguroThis skill contains only documentation and YAML/PromQL templates. No executable code, file system access, network calls, or command execution. All static findings are false positives where markdown code block delimiters were misidentified as shell commands and percentage values as cryptographic algorithms.
Factores de riesgo
🌐 Acceso a red (1)
⚙️ Comandos externos (30)
Puntuación de calidad
Lo que puedes crear
Establecer objetivos de confiabilidad del servicio
Definir SLOs y presupuestos de errores para servicios críticos y alinear equipos en objetivos de confiabilidad.
Agregar alertas de SLO
Crear alertas de tasa de quema y reglas de grabación para detectar violaciones de SLO temprano.
Revisar tendencias de confiabilidad
Usar orientación de cadencia de revisión de SLO para seguir objetivos de confiabilidad a través de lanzamientos.
Prueba estos prompts
Explica la diferencia entre SLI, SLO y SLA para una API web y sugiere un ejemplo de SLI.
Propón un SLO de disponibilidad del 99.9 por ciento para una API y muestra una expresión SLI de PromQL.
Crea una política de presupuesto de errores con acciones al 50, 10 y 0 por ciento restante.
Redacta alertas de tasa de quema de múltiples ventanas para un SLO de disponibilidad del 99.9 por ciento usando reglas de Prometheus.
Mejores prácticas
- Comenzar con servicios orientados al usuario y SLIs simples que reflejen la experiencia del usuario
- Usar alertas de tasa de quema de múltiples ventanas para reducir ruido de alertas mientras se detectan problemas reales
- Revisar SLOs en una cadencia regular y ajustar objetivos basándose en el rendimiento real
Evitar
- Establecer SLOs del 100 por ciento sin presupuesto de errores no deja espacio para la innovación
- Usar solo métricas internas que no reflejan el impacto real del usuario
- Ignorar el estado del presupuesto de errores al enviar cambios riesgosos causa incidentes de confiabilidad
Preguntas frecuentes
¿Con qué plataformas funciona esta habilidad?
¿Cuáles son los límites de esta habilidad?
¿Puedo integrar esto con el monitoreo existente?
¿Esta habilidad accede o almacena mis datos?
¿Qué pasa si mis SLOs son violados frecuentemente?
¿Cómo se compara con herramientas SLO de proveedores?
Detalles del desarrollador
Autor
wshobsonLicencia
MIT
Repositorio
https://github.com/wshobson/agents/tree/main/plugins/observability-monitoring/skills/slo-implementationRef.
main
Estructura de archivos
📄 SKILL.md