observability-monitoring-slo-implement
Implementieren von SLOs und Fehlerbudgets
Entwerfen und Implementieren von Service Level Objectives mit SLIs und Fehlerbudgets zur Messung und Verbesserung der Systemzuverlässigkeit bei gleichzeitiger Balance zwischen Feature-Geschwindigkeit und Stabilität.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "observability-monitoring-slo-implement". Design SLOs for a new e-commerce checkout service
Erwartetes Ergebnis:
Ein umfassendes SLO-Framework einschließlich: Tier-Klassifikation (kritisch), Verfügbarkeitsziel (99,95%), Latenz-SLIs (p95 < 500ms), Fehlerraten-SLI (< 0,1%), Fehlerbudget-Berechnung (4,38 Stunden/Monat) und Burn-Rate-Warnschwellenwerte.
Verwendung von "observability-monitoring-slo-implement". Create Prometheus recording rules for SLO tracking
Erwartetes Ergebnis:
YAML-Konfiguration mit Recording-Regeln für Anfragerate, Erfolgsrate bei mehreren Zeitfenstern (5m, 30m, 1h), Latenz-Perzentile (p50, p95, p99) und Fehlerbudget-Burn-Rate-Berechnungen.
Sicherheitsaudit
SicherStatic analysis detected 57 potential issues, but manual review confirms all findings are false positives. The skill contains documentation with Python code examples for SLO implementation - no actual executable code, no network calls, and no cryptographic operations. The placeholder URLs use example.com domain. This is a legitimate DevOps reliability skill.
Probleme mit mittlerem Risiko (2)
Probleme mit niedrigem Risiko (3)
Qualitätsbewertung
Was du bauen kannst
Definieren von SLOs für einen neuen API-Dienst
Erstellen von Verfügbarkeits-, Latenz- und Fehlerraten-SLOs mit geeigneten Zielen basierend auf Service-Kritikalität
Einrichten von Fehlerbudget-Warnungen
Konfigurieren von Multi-Window-Burn-Rate-Warnungen zur Erkennung von schnellem und langsamem Fehlerbudget-Verbrauch
Etablieren von SLO-Review-Prozessen
Erstellen von wöchentlichen SLO-Review-Vorlagen und Governance-Prozessen für Engineering-Teams
Probiere diese Prompts
Helfen Sie mir, SLOs für meinen Zahlungsabwicklungsdienst zu entwerfen. Er verarbeitet 10.000 Anfragen pro Minute und erfordert hohe Zuverlässigkeit. Welches Verfügbarkeitsziel sollte ich setzen und wie definiere ich die SLIs?
Ich muss SLIs für einen REST-API-Dienst mit Prometheus implementieren. Zeigen Sie mir, wie ich Verfügbarkeits- und Latenz-SLI-Abfragen erstelle, die den Prozentsatz erfolgreicher Anfragen und Anfragen unter 500ms verfolgen.
Konfigurieren Sie Fehlerbudget-Burn-Rate-Warnungen für meinen Dienst mit einem 99,9% SLO-Ziel. Ich benötige sowohl Fast-Burn- (sofortige Benachrichtigung) als auch Slow-Burn- (Ticket erstellen) Warnregeln.
Etablieren Sie ein SLO-Governance-Framework für mein Team mit Rollen und Verantwortlichkeiten, wöchentlichen Review-Vorlagen und Stakeholder-Kommunikationsprozessen.
Bewährte Verfahren
- Beginnen Sie mit konservativen SLO-Zielen und verschärfen Sie diese basierend auf tatsächlichen Service-Performance-Daten
- Verwenden Sie mehrere Zeitfenster für Burn-Rate-Warnungen, um sowohl schnellen als auch langsamen Budgetverbrauch zu erkennen
- Richten Sie SLO-Ziele an Geschäftsprioritäten und Benutzererwartungen aus, nicht an technischer Bequemlichkeit
Vermeiden
- Zu enge SLO-Ziele von Anfang an setzen, was zu ständigen Warnungen und Warnmüdigkeit führt
- Nur Verfügbarkeits-SLIs verwenden ohne Latenz- oder Qualitätsmetriken zu berücksichtigen
- SLOs ohne Stakeholder-Abstimmung oder Geschäftskontext erstellen