datadog-automation
أتمتة مهام مراقبة وملاحظة Datadog
تعد إدارة عمليات مراقبة Datadog يدويًا مستهلكة للوقت وعرضة للأخطاء. يقوم هذا المهارة بأتمتة استعلامات المقاييس والبحث في السجلات وإدارة الشاشات ولوحات المعلومات من خلال تكامل Rube MCP.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "datadog-automation". استعلام استخدام CPU لـ web01 آخر 5 دقائق
النتيجة المتوقعة:
تم استرجاع 60 نقطة بيانات تعرض متوسط استخدام CPU يتراوح من 12٪ إلى 45٪، مع القيمة الحالية عند 23٪. لم يتم اكتشاف أي شذوذ في السلسلة الزمنية.
استخدام "datadog-automation". البحث عن سجلات الأخطاء لخدمة الدفع
النتيجة المتوقعة:
تم العثور على 127 سجل أخطاء مطابق للمعايير. أهم الأخطاء: ConnectionTimeout (45٪) و DatabaseError (30٪) و ValidationError (25٪). أحدث خطأ حدث قبل 2 دقيقة.
التدقيق الأمني
آمنThis skill is documentation-only (SKILL.md) describing workflows for Datadog automation via Rube MCP. All 116 static analysis findings are false positives: backtick detections are Markdown code formatting, not shell execution. The hardcoded URL is documentation for MCP server setup. No executable code present. Network and external command risks are managed through the Rube MCP intermediary service with user-authenticated Datadog connections.
مشكلات منخفضة المخاطر (1)
عوامل الخطر
🌐 الوصول إلى الشبكة (1)
⚙️ الأوامر الخارجية (1)
درجة الجودة
ماذا يمكنك بناءه
استجابة حوادث مهندس DevOps
استعلام سريع لسجلات الأخطاء والمقاييس أثناء الحوادث وإنشاء شاشات لأنماط الفشل الجديدة وكتم التنبيهات خلال نوافذ الصيانة المخططة.
إدارة لوحات معلومات SRE
إنشاء وصيانة لوحات معلومات صحة الخدمات وإعداد شاشات التنبيه مع عتبات مناسبة وإ جدولة فترات التوقف للنشر.
إعداد ملاحظة فريق المنصة
أتمتة الإعداد الأولي للمراقبة للخدمات الجديدة بما في ذلك استعلامات المقاييس وفهرس السجلات والخطوط الأساسية للشاشات ولوحات معلومات الفريق.
جرّب هذه الموجهات
استعلام متوسط استخدام CPU للمضيف web01 خلال آخر 5 دقائق باستخدام مقاييس Datadog.
البحث عن جميع سجلات الأخطاء من خدمة الدفع في الساعة الأخيرة، مرتبة بالأحدث أولاً، تحديد إلى 50 إدخالاً.
إنشاء شاشة تنبيه مقياس باسم 'استخدام ذاكرة عالي' التي يتم تشغيلها عندما يتجاوز متوسط استخدام الذاكرة 85٪ على المضيفات الإنتاجية. إرسال الإشعارات إلى قناة ops-slack.
جدولة فترة توقف لجميع المضيفات بعلامة env:staging من الساعة 2 صباحًا حتى 4 صباحًا بتوقيت UTC غدًا مع الرسالة 'نافذة صيانة النشر المجدولة'.
أفضل الممارسات
- قم دائمًا باستدعاء RUBE_SEARCH_TOOLS أولاً للحصول على مخططات الأدوات الحالية قبل تنفيذ سير العمل
- استخدم مرشحات علامات محددة في الاستعلامات لتقليل ضوضاء النتائج وتحسين الأداء
- تعيين أوقات نهاية صريحة لفترات التوقف لتجنب قمع التنبيهات إلى أجل غير محدد
تجنب
- لا تقم بإنشاء شاشات بدون تحديد عتبات تنبيه ورسائل إشعار واضحة
- تجنب الاستعلام عن نطاقات زمنية واسعة جدًا تتجاوز حدود الاحتفاظ بـ Datadog
- لا تحذف لوحات المعلومات بدون تأكيد نسخ إعدادات المكونات