المهارات observability-monitoring-monitor-setup
📦

observability-monitoring-monitor-setup

آمن

إعداد مراقبة شاملة وقابلية الملاحظة

تنفيذ المراقبة من الصفر معقد وعرضة للأخطاء. توفر هذه المهارة أنماطًا مثبتة لمقاييس الأداء والتتبع والتسجيل التي تقلل من متوسط وقت الإصلاح وتمنح رؤية كاملة للنظام.

يدعم: Claude Codex Code(CC)
📊 71 كافٍ
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "observability-monitoring-monitor-setup". إعداد كشط Prometheus لمجموعة Kubernetes مع اكتشاف Pods التلقائي

النتيجة المتوقعة:

  • تكوين Prometheus مع kubernetes_sd_configs للاكتشاف التلقائي
  • تعليقات Pods المطلوبة لاستهداف الكشط
  • قواعد إعادة التسمية لتصفية ووضع علامات على الأهداف المكتشفة
  • خطوات التحقق للتأكد من أن الكشط يعمل

استخدام "observability-monitoring-monitor-setup". إنشاء تنبيه لاستخدام الذاكرة يتجاوز 90%

النتيجة المتوقعة:

  • تعبئة PromQL باستخدام container_memory_working_set_bytes
  • قاعدة التنبيه مع العتبات والمدة المناسبة
  • خطوات Runbook للتحقيق في ضغط الذاكرة
  • استعلام لوحة Grafana لتصور اتجاهات الذاكرة

التدقيق الأمني

آمن
v1 • 2/24/2026

This skill contains documentation and code samples for monitoring setup. All static analysis findings are false positives - backticks are markdown code block delimiters, not shell execution. URLs are internal service endpoints. Environment variable usage follows standard configuration patterns. No malicious patterns detected.

2
الملفات التي تم فحصها
557
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
31
المجتمع
100
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

مراقبة الخدمات الجديدة

إعداد كومة مراقبة شاملة للخدمات المصغرة الجديدة من اليوم الأول مع المقاييس والتتبع والتسجيل.

الاستجابة لحوادث الإنتاج

إنشاء لوحات تحكم وتنبيهات قابلة للتنفيذ لتقليل متوسط وقت الإصلاح وتمكين اكتشاف المشكلات الاستباقي.

تعريف وتتبع أهداف مستوى الخدمة

تحديد أهداف مستوى الخدمة مع ميزانيات الأخطاء وتنفيذ مراقبة معدل الاحتراق لهندسة الموثوقية.

جرّب هذه الموجهات

إعداد المقاييس الأساسية
ساعدني في إضافة مقاييس Prometheus إلى واجهة برمجة تطبيقات Node.js الخاصة بي. أحتاج إلى عدد الطلبات ومعدل الأخطاء وتتبع زمن الاستجابة. اعرض لي إعداد prom-client وكيفية كشف نقطة النهاية /metrics.
إنشاء لوحة Grafana
إنشاء JSON لوحة Grafana لخدمة الدفع الخاصة بي تعرض الإشارات الأربعة الأساسية. include لوحات لمعدل الطلبات ومعدل الأخطاء وزمن الاستجابة p95/p99 ومقاييس التشبع.
تكوين التنبيهات
أحتاج إلى قواعد التنبيه لمعدل خطأ مرتفع (>5% لمدة 5 دقائق) ووقت استجابة بطيء (p95 >1 ثانية لمدة 10 دقائق). قم بتكوين Alertmanager لتوجيه التنبيهات الحرجة إلى PagerDuty والتحذيرات إلى Slack.
تنفيذ أهداف مستوى الخدمة
تحديد أهداف مستوى الخدمة لواجهة برمجة التطبيقات الخاصة بي مع هدف توفر 99.9% خلال 30 يومًا. اعرض لي كيفية حساب ميزانية الأخطاء وإعداد تنبيهات معدل الاحتراق متعدد النوافذ وإنشاء لوحات Grafana لتتبع أهداف مستوى الخدمة.

أفضل الممارسات

  • استخدم مجموعات الرسم البياني المتوافقة مع أهداف مستوى الخدمة لحساب النسب المئوية الدقيق
  • أضف علامات متسقة (الخدمة، البيئة، الإصدار) إلى جميع المقاييس للتصفية الفعالة
  • اختبر التنبيهات على البيانات التاريخية لتقليل الإيجابيات الكاذبة قبل تفعيل الإشعارات

تجنب

  • مراقبة كل شيء بدون ملكية واضحة تؤدي إلى إرهاق التنبيهات وتجاهل الصفحات
  • استخدام متوسط زمن الاستجابة بدلاً من النسب المئوية يخفي مشاكل زمن الاستجابة الذيلي التي تؤثر على المستخدمين
  • إعداد لوحات التحكم قبل تحديد الأسئلة التي يجب أن تجيبها يضيع الجهد

الأسئلة المتكررة

كيف أختار فاصل الكشط المناسب لمقاييسي؟
ابدأ بـ 15 ثانية لمعظم الخدمات. استخدم 5 ثوانٍ للأنظمة الحساسة لزمن الاستجابة أو عند التصحيح. تجنب الفواصل أقل من 5 ثوانٍ لأنها تزيد من حمل Prometheus بدون فائدة متناسبة.
هل يجب أن أتابع كل طلب أو أستخدم أخذ العينات؟
اختبار العينات في الإنتاج. استخدم أخذ العينات القائمة على الرأس (مثلاً 10% من الطلبات) للخدمات عالية الحركة. تتبع 100% في staging. تتبع دائمًا الأخطاء بغض النظر عن معدل أخذ العينات.
ما الفرق بين مراقبة RED و USE؟
RED (المعدل، الأخطاء، المدة) للخدمات الموجهة للمستخدم. USE (الاستخدام، التشبع، الأخطاء) لموارد البنية التحتية. استخدم RED لمراقبة التطبيقات، و USE للعقد وقواعد البيانات.
كيف أحدد أهداف م��توى الخدمة ذات معنى؟
حدد الأهداف بناءً على توقعات المستخدمين ومتطلبات العمل، وليس الأداء الحالي. ابدأ بشكل محافظ (99%) وضيق مع تحسن الموثوقية. قياس على فترات 28-30 يومًا.
هل أحتاج جميع الأعمدة الثلاثة (المقاييس، السجلات، التتبع) من اليوم الأول؟
ابدأ بالمقاييس - هي الأرخص وتجيب على 'ما هو المعطل'. أضف التسجيل لـ 'لماذا تعطل'. أضف التتبع للأنظمة الموزعة عندما يصبح تصحيح المشكلات عبر الخدمات صعبًا.
كم من الوقت يجب أن أحتفظ ببيانات المراقبة؟
احتفظ بمقاييس دقة عالية (عينات خام) لمدة 15-30 يومًا للتصحيح. استخدم أخذ العينات المخفضة أو قواعد التسجيل للاتجاهات طويلة المدى. خزن السجلات بناءً ��لى متطلبات الامتثال، عادة 90 يومًا كحد أدنى.

تفاصيل المطور

بنية الملفات