datadog-automation
Automatizar Tarefas de Monitoramento e Observabilidade do Datadog
Gerenciar operações de monitoramento do Datadog manualmente é demorado e propenso a erros. Esta skill automatiza consultas de métricas, buscas de logs, gerenciamento de monitores e operações de dashboards através da integração Rube MCP.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "datadog-automation". Consultar uso de CPU para web01 últimos 5 minutos
Resultado esperado:
Retrieved 60 data points showing average CPU usage ranging from 12% to 45%, with current value at 23%. No anomalies detected in the time series.
A utilizar "datadog-automation". Pesquisar logs de erro para serviço de pagamento
Resultado esperado:
Found 127 error logs matching criteria. Top errors: ConnectionTimeout (45%), DatabaseError (30%), ValidationError (25%). Most recent error occurred 2 minutes ago.
Auditoria de Segurança
SeguroThis skill is documentation-only (SKILL.md) describing workflows for Datadog automation via Rube MCP. All 116 static analysis findings are false positives: backtick detections are Markdown code formatting, not shell execution. The hardcoded URL is documentation for MCP server setup. No executable code present. Network and external command risks are managed through the Rube MCP intermediary service with user-authenticated Datadog connections.
Problemas de Baixo Risco (1)
Fatores de risco
🌐 Acesso à rede (1)
⚙️ Comandos externos (1)
Pontuação de qualidade
O Que Você Pode Construir
Resposta a Incidentes para Engenheiro DevOps
Consultar rapidamente logs de erros e métricas durante incidentes, criar monitores para novos padrões de falha e silenciar alertas durante janelas de manutenção planejadas.
Gerenciamento de Dashboard para SRE
Criar e manter dashboards de saúde de serviço, configurar monitores de alerta com limites apropriados e gerenciar cronogramas de downtime para implantações.
Configuração de Observabilidade para Plataforma
Automatizar a configuração inicial de monitoramento para novos serviços, incluindo consultas de métricas, indexes de log, monitores de baseline e dashboards de equipe.
Tente Estes Prompts
Query the average CPU usage for host web01 over the last 5 minutes using Datadog metrics.
Search for all error logs from the payment service in the last hour, sorted by most recent first, limit to 50 entries.
Create a metric alert monitor named 'High Memory Usage' that triggers when avg memory usage exceeds 85% on production hosts. Send notifications to the ops-slack channel.
Schedule a downtime for all hosts with tag env:staging from 2am to 4am UTC tomorrow with the message 'Scheduled deployment maintenance window'.
Melhores Práticas
- Sempre chame RUBE_SEARCH_TOOLS primeiro para obter os esquemas de ferramentas atuais antes de executar fluxos de trabalho
- Use filtros de tags específicos nas consultas para reduzir ruídos nos resultados e melhorar o desempenho
- Defina tempos de término explícitos para downtimes para evitar supressão indefinida de alertas
Evitar
- Não crie monitores sem definir limites de alerta claros e mensagens de notificação
- Evite consultar intervalos de tempo muito amplos que excedam os limites de retenção do Datadog
- Não exclua dashboards sem confirmar o backup das configurações de widgets
Perguntas Frequentes
Como conecto minha conta do Datadog a esta skill?
Qual formato de timestamp devo usar para consultas?
Posso criar monitores personalizados com esta skill?
Como manejo a paginação para conjuntos de resultados grandes?
O que acontece se atingir os limites de taxa do Datadog?
Posso silenciar um monitor sem excluí-lo?
Detalhes do Desenvolvedor
Autor
sickn33Licença
MIT
Repositório
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/datadog-automationReferência
main
Estrutura de arquivos
📄 SKILL.md