slo-implementation
SLOs mit Fehlerbudgets und Warnungen definieren
Zuverlässigkeitsziele sind oft unklar und schwer zu messen. Diese Fähigkeit bietet SLI-, SLO- und Fehlerbudget-Vorlagen mit Warnleitfäden für die Implementierung von SRE-Praktiken.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "slo-implementation". Erstelle einen SLO-Plan für einen API-Dienst
Erwartetes Ergebnis:
- Verfügbarkeits-SLO bei 99,9 Prozent über 28 Tage
- PromQL-SLI-Verhältnis für erfolgreiche Anfragen-Berechnung
- Fehlerbudget-Richtlinie mit Aktionen bei 50, 10 und 0 Prozent verbleibendem Budget
- Schneller Burn-Rate-Warnschwellenwert bei 14,4x über 5-Minuten-Fenster
- Langsamer Burn-Rate-Warnschwellenwert bei 6x über 6-Stunden-Fenster
Verwendung von "slo-implementation". Wie berechne ich das Fehlerbudget für einen SLO von 99,5 Prozent
Erwartetes Ergebnis:
- Fehlerbudget beträgt 0,5 Prozent = 3,6 Stunden pro Monat
- Fehlerbudget-Formel: 1 minus SLO-Ziel
- Verbleibendes Budget gegen tatsächliche Fehlerrate verfolgen
- Warnschwellenwerte für schnelle und langsame Burn-Raten festlegen
Verwendung von "slo-implementation". Was sind gute SLO-Ziele für eine kundenorientierte API
Erwartetes Ergebnis:
- Verfügbarkeits-SLO von 99,9 Prozent ist üblich für APIs
- Latenz-SLO bei p99 unter 500 Millisekunden für die meisten Endpunkte
- Fehlerbudget von 0,1 Prozent erlaubt 43 Minuten Ausfallzeit pro Monat
- Strengere SLOs für kritische Zahlungsendpunkte in Betracht ziehen
Sicherheitsaudit
SicherThis skill contains only documentation and YAML/PromQL templates. No executable code, file system access, network calls, or command execution. All static findings are false positives where markdown code block delimiters were misidentified as shell commands and percentage values as cryptographic algorithms.
Risikofaktoren
🌐 Netzwerkzugriff (1)
⚙️ Externe Befehle (30)
Qualitätsbewertung
Was du bauen kannst
Zuverlässigkeitsziele für Dienste festlegen
SLOs und Fehlerbudgets für kritische Dienste definieren und Teams auf Zuverlässigkeitsziele ausrichten.
SLO-Warnungen hinzufügen
Burn-Rate-Warnungen und Aufzeichnungsregeln erstellen, um SLO-Verstöße frühzeitig zu erkennen.
Zuverlässigkeitstrends überprüfen
SLO-Review-Rhythmus-Leitfaden verwenden, um Zuverlässigkeitsziele über Releases hinweg zu verfolgen.
Probiere diese Prompts
Erkläre den Unterschied zwischen SLI, SLO und SLA für eine Web-API und schlage ein Beispiel-SLI vor.
Schlage einen Verfügbarkeits-SLO von 99,9 Prozent für eine API vor und zeige einen PromQL-SLI-Ausdruck.
Erstelle eine Fehlerbudget-Richtlinie mit Aktionen bei 50, 10 und 0 Prozent verbleibendem Budget.
Entwirf Multi-Window-Burn-Rate-Warnungen für einen Verfügbarkeits-SLO von 99,9 Prozent mit Prometheus-Regeln.
Bewährte Verfahren
- Mit dienstorientierten Diensten und einfachen SLIs beginnen, die die Nutzererfahrung widerspiegeln
- Multi-Window-Burn-Rate-Warnungen verwenden, um Warnrauschen zu reduzieren und gleichzeitig echte Probleme zu erkennen
- SLOs regelmäßig überprüfen und Ziele basierend auf tatsächlicher Leistung anpassen
Vermeiden
- 100-Prozent-SLOs ohne Fehlerbudget festlegen lässt keinen Raum für Innovation
- Nur interne Metriken verwenden, die keine tatsächliche Auswirkung auf Nutzer widerspiegeln
- Fehlerbudget-Status ignorieren, wenn risikoreiche Änderungen ausgeliefert werden, verursacht Zuverlässigkeitsvorfälle