技能 observability-monitoring-monitor-setup
📦

observability-monitoring-monitor-setup

安全

إعداد مراقبة شاملة وقابلية الملاحظة

تنفيذ المراقبة من الصفر معقد وعرضة للأخطاء. توفر هذه المهارة أنماطًا مثبتة لمقاييس الأداء والتتبع والتسجيل التي تقلل من متوسط وقت الإصلاح وتمنح رؤية كاملة للنظام.

支持: Claude Codex Code(CC)
🥉 74 青铜
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“observability-monitoring-monitor-setup”。 إعداد كشط Prometheus لمجموعة Kubernetes مع اكتشاف Pods التلقائي

预期结果:

  • تكوين Prometheus مع kubernetes_sd_configs للاكتشاف التلقائي
  • تعليقات Pods المطلوبة لاستهداف الكشط
  • قواعد إعادة التسمية لتصفية ووضع علامات على الأهداف المكتشفة
  • خطوات التحقق للتأكد من أن الكشط يعمل

正在使用“observability-monitoring-monitor-setup”。 إنشاء تنبيه لاستخدام الذاكرة يتجاوز 90%

预期结果:

  • تعبئة PromQL باستخدام container_memory_working_set_bytes
  • قاعدة التنبيه مع العتبات والمدة المناسبة
  • خطوات Runbook للتحقيق في ضغط الذاكرة
  • استعلام لوحة Grafana لتصور اتجاهات الذاكرة

安全审计

安全
v1 • 2/24/2026

This skill contains documentation and code samples for monitoring setup. All static analysis findings are false positives - backticks are markdown code block delimiters, not shell execution. URLs are internal service endpoints. Environment variable usage follows standard configuration patterns. No malicious patterns detected.

2
已扫描文件
557
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
50
社区
100
安全
91
规范符合性

你能构建什么

مراقبة الخدمات الجديدة

إعداد كومة مراقبة شاملة للخدمات المصغرة الجديدة من اليوم الأول مع المقاييس والتتبع والتسجيل.

الاستجابة لحوادث الإنتاج

إنشاء لوحات تحكم وتنبيهات قابلة للتنفيذ لتقليل متوسط وقت الإصلاح وتمكين اكتشاف المشكلات الاستباقي.

تعريف وتتبع أهداف مستوى الخدمة

تحديد أهداف مستوى الخدمة مع ميزانيات الأخطاء وتنفيذ مراقبة معدل الاحتراق لهندسة الموثوقية.

试试这些提示

إعداد المقاييس الأساسية
ساعدني في إضافة مقاييس Prometheus إلى واجهة برمجة تطبيقات Node.js الخاصة بي. أحتاج إلى عدد الطلبات ومعدل الأخطاء وتتبع زمن الاستجابة. اعرض لي إعداد prom-client وكيفية كشف نقطة النهاية /metrics.
إنشاء لوحة Grafana
إنشاء JSON لوحة Grafana لخدمة الدفع الخاصة بي تعرض الإشارات الأربعة الأساسية. include لوحات لمعدل الطلبات ومعدل الأخطاء وزمن الاستجابة p95/p99 ومقاييس التشبع.
تكوين التنبيهات
أحتاج إلى قواعد التنبيه لمعدل خطأ مرتفع (>5% لمدة 5 دقائق) ووقت استجابة بطيء (p95 >1 ثانية لمدة 10 دقائق). قم بتكوين Alertmanager لتوجيه التنبيهات الحرجة إلى PagerDuty والتحذيرات إلى Slack.
تنفيذ أهداف مستوى الخدمة
تحديد أهداف مستوى الخدمة لواجهة برمجة التطبيقات الخاصة بي مع هدف توفر 99.9% خلال 30 يومًا. اعرض لي كيفية حساب ميزانية الأخطاء وإعداد تنبيهات معدل الاحتراق متعدد النوافذ وإنشاء لوحات Grafana لتتبع أهداف مستوى الخدمة.

最佳实践

  • استخدم مجموعات الرسم البياني المتوافقة مع أهداف مستوى الخدمة لحساب النسب المئوية الدقيق
  • أضف علامات متسقة (الخدمة، البيئة، الإصدار) إلى جميع المقاييس للتصفية الفعالة
  • اختبر التنبيهات على البيانات التاريخية لتقليل الإيجابيات الكاذبة قبل تفعيل الإشعارات

避免

  • مراقبة كل شيء بدون ملكية واضحة تؤدي إلى إرهاق التنبيهات وتجاهل الصفحات
  • استخدام متوسط زمن الاستجابة بدلاً من النسب المئوية يخفي مشاكل زمن الاستجابة الذيلي التي تؤثر على المستخدمين
  • إعداد لوحات التحكم قبل تحديد الأسئلة التي يجب أن تجيبها يضيع الجهد

常见问题

كيف أختار فاصل الكشط المناسب لمقاييسي؟
ابدأ بـ 15 ثانية لمعظم الخدمات. استخدم 5 ثوانٍ للأنظمة الحساسة لزمن الاستجابة أو عند التصحيح. تجنب الفواصل أقل من 5 ثوانٍ لأنها تزيد من حمل Prometheus بدون فائدة متناسبة.
هل يجب أن أتابع كل طلب أو أستخدم أخذ العينات؟
اختبار العينات في الإنتاج. استخدم أخذ العينات القائمة على الرأس (مثلاً 10% من الطلبات) للخدمات عالية الحركة. تتبع 100% في staging. تتبع دائمًا الأخطاء بغض النظر عن معدل أخذ العينات.
ما الفرق بين مراقبة RED و USE؟
RED (المعدل، الأخطاء، المدة) للخدمات الموجهة للمستخدم. USE (الاستخدام، التشبع، الأخطاء) لموارد البنية التحتية. استخدم RED لمراقبة التطبيقات، و USE للعقد وقواعد البيانات.
كيف أحدد أهداف م��توى الخدمة ذات معنى؟
حدد الأهداف بناءً على توقعات المستخدمين ومتطلبات العمل، وليس الأداء الحالي. ابدأ بشكل محافظ (99%) وضيق مع تحسن الموثوقية. قياس على فترات 28-30 يومًا.
هل أحتاج جميع الأعمدة الثلاثة (المقاييس، السجلات، التتبع) من اليوم الأول؟
ابدأ بالمقاييس - هي الأرخص وتجيب على 'ما هو المعطل'. أضف التسجيل لـ 'لماذا تعطل'. أضف التتبع للأنظمة الموزعة عندما يصبح تصحيح المشكلات عبر الخدمات صعبًا.
كم من الوقت يجب أن أحتفظ ببيانات المراقبة؟
احتفظ بمقاييس دقة عالية (عينات خام) لمدة 15-30 يومًا للتصحيح. استخدم أخذ العينات المخفضة أو قواعد التسجيل للاتجاهات طويلة المدى. خزن السجلات بناءً ��لى متطلبات الامتثال، عادة 90 يومًا كحد أدنى.