Compétences monitoring-observability
📊

monitoring-observability

Sûr

Configurer la surveillance et l'observabilité

Cette compétence aide les développeurs et les ingénieurs DevOps à mettre en œuvre des systèmes complets de surveillance, de journalisation et d'alerte en utilisant des outils standard de l'industrie comme Prometheus et Grafana.

Prend en charge: Claude Codex Code(CC)
📊 71 Adéquat
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "monitoring-observability". Configurer les métriques Prometheus pour mon application Express

Résultat attendu:

Configuration du point de terminaison des métriques avec histogramme personnalisé pour la durée des requêtes, compteur pour le nombre total de requêtes et métriques système par défaut.

Utilisation de "monitoring-observability". Créer des alertes pour un taux d'erreur élevé

Résultat attendu:

Règle d'alerte Prometheus avec évaluation de 5 minutes, seuil de 5% pour les erreurs 5xx, étiquette de sévérité critique.

Audit de sécurité

Sûr
v1 • 3/10/2026

This is a documentation skill containing example code for monitoring systems. All static findings are false positives: the detected patterns are legitimate code examples (TypeScript, YAML), standard Node.js environment variable usage for configuration, documentation links to known monitoring tools, and Prometheus query syntax. No actual security risks present.

2
Fichiers analysés
417
Lignes analysées
0
résultats
1
Total des audits
Aucun problème de sécurité trouvé

Motifs détectés

External Commands False PositiveNetwork Access False PositiveEnvironment Variable False PositivePath Traversal False Positive
Audité par: claude

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
31
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Configuration de la surveillance en production

Mettre en place une surveillance complète avant de déployer les applications en production

Préparation à la réponse aux incidents

Créer des règles d'alerte et des tableaux de bord pour une identification rapide de la cause racine pendant les incidents

Optimisation des performances

Identifier les goulots d'étranglement grâce à la collecte et la visualisation des métriques

Essayez ces prompts

Configuration Prometheus de base
Configurer la collecte de métriques Prometheus pour mon application Node.js Express. Inclure les métriques par défaut et un histogramme personnalisé pour la durée des requêtes HTTP.
Configuration des alertes
Créer des règles d'alerte Prometheus pour un taux d'erreur élevé (erreurs 5xx supérieures à 5%), un temps de réponse lent (p95 supérieur à 1 seconde) et une indisponibilité du service.
Journalisation structurée
Implémenter le logger Winston avec format JSON, horodatage et traces d'erreur pour mon application Node.js.
Point de terminaison de vérification de l'état
Créer un point de terminaison /health qui vérifie la connectivité de la base de données, la disponibilité de Redis et retourne l'état global du service.

Bonnes pratiques

  • Définir des objectifs de niveau de service (SLO) clairs avant de configurer les alertes pour éviter la fatigue d'alertes
  • Utiliser les étiquettes à cardinalité élevée avec précaution pour éviter les problèmes de performance dans Prometheus
  • Écrire des runbooks pour chaque alerte afin de permettre une réponse rapide aux incidents

Éviter

  • Ne pas journaliser de données sensibles comme les mots de passe, les clés API ou les informations personnellement identifiables
  • Éviter de créer trop d'alertes ce qui entraîne de la fatigue d'alertes et des notifications ignorées
  • Ne pas utiliser d'étiquettes à cardinalité élevée comme les IDs utilisateur ou les jetons de session dans les métriques

Foire aux questions

Quelle est la différence entre les métriques et les journaux ?
Les métriques sont des mesures numériques collectées à des intervalles (comme le taux de requêtes), tandis que les journaux sont des événements discrets avec un contexte détaillé. Utilisez les métriques pour les alertes et les tableaux de bord, les journaux pour le débogage de problèmes spécifiques.
Que sont les signaux clés dans la surveillance ?
Les signaux clés sont quatre métriques essentielles : la latence (temps de réponse), le trafic (volume de requêtes), les erreurs (taux d'erreur) et la saturation (utilisation des ressources). Celles-ci offrent une visibilité complète sur la santé du système.
Comment éviter la fatigue d'alertes ?
Créez uniquement des alertes pour des problèmes actionnables nécessitant une réponse immédiate. Définissez des seuils et des durées d'évaluation appropriés. Documentez un runbook pour chaque alerte.
Qu'est-ce que le modèle pull de Prometheus ?
Prometheus récupère les métriques des cibles à des intervalles configurés plutôt que d'avoir les applications à envoyer les données. Cela offre une meilleure fiabilité et simplifie le code de l'application.
Comment surveiller des métriques métier personnalisées ?
Utilisez les bibliothèques clientes Prometheus pour définir des compteurs, jauges, histogrammes ou résumés personnalisés dans votre code d'application. Exposez-les via un point de terminaison /metrics.
Que doit contenir une vérification de l'état ?
Une vérification de l'état doit vérifier les dépendances critiques (base de données, cache, API externes), retourner l'état global (sain/dégradé/malsain) et inclure les informations de latence pour chaque vérification.

Détails du développeur

Structure de fichiers

📄 SKILL.md

📄 SKILL.toon