debugging-toolkit-smart-debug
Debuggen von Produktionsproblemen mit KI-gestützter Ursachenanalyse
Reduzieren Sie die mittlere Zeit zur Lösung von Produktionsvorfällen, indem Sie systematische Debugging-Workflows mit KI-gestützter Mustererkennung kombinieren. Erhalten Sie strukturierte Hypothesengenerierung, Korrelation von Observability-Daten und validierte Fix-Empfehlungen.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "debugging-toolkit-smart-debug". Checkout-Timeout-Fehler beeinträchtigen 5% des Produktionsverkehrs, intermittierend
Erwartetes Ergebnis:
- Problemzusammenfassung: Timeouts bei der Zahlungsabwicklung in 5% der Checkout-Anfragen
- Top-Hypothese (75%): N+1-Abfrage-Muster bei der Zahlungsmethode-Verifizierung - gestützt durch Trace-Analyse mit 15+ sequentiellen Datenbankaufrufen
- Debugging-Strategie: Span-Attribute für Abfrageanzahl und Zahlungsmethoden-ID hinzufügen, Canary zu 10% Verkehr deployen
- Validierung: Vergleich von Latenz-Perzentilen und Abfrageanzahlen zwischen Kontroll- und Canary-Gruppen
Verwendung von "debugging-toolkit-smart-debug". Speicherleck im Hintergrund-Job-Prozessor vermutet
Erwartetes Ergebnis:
- Problemzusammenfassung: Allmähliches Speicherwachstum in Job-Prozessor-Pods, Neustart alle 6 Stunden erforderlich
- Top-Hypothese (60%): Unbegrenztes Cache-Wachstum ohne Eviction-Richtlinie
- Debugging-Strategie: Heap-Profilierung mit Pyroscope aktivieren, Heap-Snapshots in Intervallen erfassen
- Validierung: RSS-Speichertrends nach Implementierung von Cache-Größenlimits überwachen
Sicherheitsaudit
SicherAll static analysis findings were determined to be false positives. The flagged patterns are markdown syntax (backticks for inline code), YAML frontmatter, and documentation examples - not executable code. Line 23 uses backticks for file path reference in markdown. Lines 147-184 contain TypeScript documentation examples illustrating the debugging workflow. No actual command execution, cryptographic operations, or network reconnaissance code exists in this skill.
Qualitätsbewertung
Was du bauen kannst
Produktionsvorfall-Triage
Schnelle Analyse eingehender Produktionsalarme, Korrelation von Fehlern über Services hinweg und Generierung erster Hypothesen für On-Call-Ingenieure zur Untersuchung
Untersuchung intermittierender Bugs
Anwendung statistischer Debugging-Techniken zur Identifizierung von Mustern in Ausfällen, die einen kleinen Prozentsatz der Benutzer oder Anfragen betreffen
Post-Mortem-Ursachenanalyse
Rekonstruktion von Ausführungspfaden, Identifizierung beitragender Faktoren und Generierung von Präventionsempfehlungen für Vorfallsdokumentation
Probiere diese Prompts
Analysieren Sie diesen Fehler und identifizieren Sie die wahrscheinlichste Ursache: [Fehlermeldung oder Stack-Trace einfügen]. Geben Sie die betroffene Komponente und den empfohlenen ersten Debugging-Schritt an.
Generieren Sie 3-5 Hypothesen mit Rangliste für dieses Problem: [Symptome beschreiben]. Geben Sie für jede Hypothese den Wahrscheinlichkeitswert, die benötigten unterstützenden Nachweise und die Möglichkeit zur Falsifizierung an.
Entwerfen Sie Abfragen zur Untersuchung von [spezifischem Problem] über [Plattformen auflisten: Sentry, DataDog, Logs]. Geben Sie spezifische Filter, Zeitbereiche und Korrelationsschlüssel an, um betroffene Benutzer und Muster zu identifizieren.
Erstellen Sie einen Debugging-Plan für [Problem], der in der Produktion ohne Auswirkungen auf Benutzer ausgeführt werden kann. Geben Sie Instrumentierungspunkte, Feature-Flag-Design, Sampling-Strategie und Rollback-Kriterien an.
Bewährte Verfahren
- Korrelieren Sie Fehler immer mit Deployment-Zeitplänen, um kürzliche Änderungen als potenzielle Ursachen zu identifizieren
- Verwenden Sie bedingte Instrumentierung und Feature Flags, um Debug-Logging für spezifische Benutzerkohorten zu aktivieren, ohne die Gesamtsystemleistung zu beeinträchtigen
- Dokumentieren Sie den vollständigen Hypothesen-Testprozess einschließlich falsifizierter Hypothesen, um zukünftige Ermittler davon abzuhalten, dieselben Pfade zu wiederholen
Vermeiden
- Hinzufügen von übermäßigem Logging ohne Sampling oder Rate Limiting, was zu Log-Volumenspitzen führt, die das Signal verdecken
- Versuch, komplexe Produktionsprobleme in der Entwicklung zu reproduzieren, ohne zuerst ausreichende Observability-Daten zu sammeln
- Implementierung von Fixes ohne Festlegung klarer Erfolgskriterien und Rollback-Pläne vor dem Deployment
Häufig gestellte Fragen
Welche Observability-Plattformen unterstützt dieser Skill?
Kann dieser Skill direkt auf meine Produktionssysteme zugreifen?
Wie gehe ich mit sensiblen Daten in Fehlerprotokollen während des Debuggings um?
Was passiert, wenn die KI-generierten Hypothesen alle falsch sind?
Wie weiß ich, wann ich eskalieren soll, anstatt die Untersuchung fortzusetzen?
Kann dieser Skill nach der Bereitstellung des Fixes bei der Prävention helfen?
Entwicklerdetails
Autor
sickn33Lizenz
MIT
Repository
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/debugging-toolkit-smart-debugRef
main
Dateistruktur
📄 SKILL.md