datadog-automation
Automatisieren von Datadog-Überwachungs- und Observability-Aufgaben
Die manuelle Verwaltung von Datadog-Überwachungsoperationen ist zeitaufwändig und fehleranfällig. Diese Fähigkeit automatisiert Metrikabfragen, Logsuchen, Monitorverwaltung und Dashboard-Operationen durch Rube MCP-Integration.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "datadog-automation". Abfrage der CPU-Auslastung für web01 letzte 5 Minuten
Résultat attendu:
60 Datenpunkte abgerufen, die eine durchschnittliche CPU-Auslastung von 12% bis 45% zeigen, mit aktuellem Wert bei 23%. Keine Anomalien in der Zeitreihe erkannt.
Utilisation de "datadog-automation". Fehlerlogs für Payment-Dienst suchen
Résultat attendu:
127 Fehlerlogs gefunden, die die Kriterien erfüllen. Häufigste Fehler: ConnectionTimeout (45%), DatabaseError (30%), ValidationError (25%). Neuester Fehler vor 2 Minuten aufgetreten.
Audit de sécurité
SûrThis skill is documentation-only (SKILL.md) describing workflows for Datadog automation via Rube MCP. All 116 static analysis findings are false positives: backtick detections are Markdown code formatting, not shell execution. The hardcoded URL is documentation for MCP server setup. No executable code present. Network and external command risks are managed through the Rube MCP intermediary service with user-authenticated Datadog connections.
Problèmes à risque faible (1)
Facteurs de risque
🌐 Accès réseau (1)
⚙️ Commandes externes (1)
Score de qualité
Ce que vous pouvez construire
DevOps-Ingenieur Incident Response
Schnelles Abfragen von Fehlerlogs und Metriken während Incidents, Erstellen von Monitoren für neue Fehlermuster und Stummschalten von Alarmen während geplanter Wartungsfenster.
SRE-Dashboard-Verwaltung
Erstellen und Warten von Service-Gesundheits-Dashboards, Einrichten von Alarm-Monitoren mit geeigneten Schwellenwerten und Verwalten von Downtime-Zeitplänen für Deployments.
Platform-Team Observability-Einrichtung
Automatisieren der anfänglichen Überwachungseinrichtung für neue Dienste einschließlich Metrikabfragen, Log-Indizes, Baseline-Monitoren und Team-Dashboards.
Essayez ces prompts
Abfrage der durchschnittlichen CPU-Auslastung für Host web01 über die letzten 5 Minuten mit Datadog-Metriken.
Suche nach allen Fehlerlogs vom Payment-Dienst in der letzten Stunde, sortiert nach neuesten zuerst, begrenzt auf 50 Einträge.
Erstelle einen Metrik-Alarm-Monitor namens 'Hohe Speicherauslastung', der auslöst, wenn die durchschnittliche Speicherauslastung 85% auf Produktions-Hosts überschreitet. Sende Benachrichtigungen an den ops-slack-Kanal.
Plane eine Downtime für alle Hosts mit Tag env:staging von 2 Uhr bis 4 Uhr UTC morgen mit der Nachricht 'Geplantes Deployment-Wartungsfenster'.
Bonnes pratiques
- Rufen Sie immer zuerst RUBE_SEARCH_TOOLS auf, um aktuelle Tool-Schemata zu erhalten, bevor Sie Workflows ausführen
- Verwenden Sie spezifische Tag-Filter in Abfragen, um Rauschen zu reduzieren und die Leistung zu verbessern
- Setzen Sie explizite Endzeiten für Downtimes, um unbegrenzte Alarmunterdrückung zu vermeiden
Éviter
- Erstellen Sie keine Monitoren ohne Definition klarer Alarm-Schwellenwerte und Benachrichtigungsmeldungen
- Vermeiden Sie das Abfragen von zu breiten Zeitbereichen, die die Datadog-Aufbewahrungslimits überschreiten
- Löschen Sie keine Dashboards ohne Bestätigung der Sicherung von Widget-Konfigurationen