Compétences error-diagnostics-error-analysis

📦

error-diagnostics-error-analysis

Name: error-diagnostics-error-analysis
Author: sickn33

Sûr

Diagnostiquer les erreurs de production

Cette compétence aide les développeurs à diagnostiquer et résoudre rapidement les erreurs de production en utilisant des techniques de débogage systématiques, l'analyse de traces distribuées et des modèles d'observabilité complets.

Prend en charge: Claude Codex Code(CC)

📊 71 Adéquat

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "error-diagnostics-error-analysis". Error: Database connection timeout after 30s in order-service

Résultat attendu:

Analyse : Épuisement du pool de connexions détecté
Cause racine : Requêtes de longue durée retenant toutes les connexions
Correctif recommandé : Implémenter le délai d'attente des requêtes et optimiser les modèles N+1
Prévention : Ajouter un disjoncteur et une surveillance du pool de connexions

Utilisation de "error-diagnostics-error-analysis". Intermittent 502 errors in API gateway

Résultat attendu:

Modèle : Les erreurs se produisent pendant les fenêtres de trafic de pointe
Corrélation : Nouvelle politique d'auto-mise à l'échelle déployée hier
Cause racine : Les services backend se mettent à l'échelle plus lentement que l'équilibreur de charge
Recommandation : Ajuster les paramètres de mise à l'échelle et ajouter une validation de vérification de santé

Audit de sécurité

Sûr

v1 • 2/24/2026

After evaluating 108 static findings, all detections are false positives. The scanner misinterpreted markdown documentation patterns as security issues: backticks in code blocks were flagged as shell execution, example URLs were flagged as network exfiltration, and environment variable reads in example error-tracking code were flagged as credential access. The sensitive data deletion code (lines 751-752) is a security best practice that removes cookies/authorization headers before sending error reports. This is a legitimate error diagnostics skill providing observability documentation.

Fichiers analysés

1,194

Lignes analysées

résultats

Total des audits

Aucun problème de sécurité trouvé

Audité par: claude

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Investiguer les incidents de production

Analyser les erreurs de production, corréler avec les déploiements et identifier la cause racine en utilisant le traçage distribué et l'analyse des journaux.

Déboguer les erreurs d'application

Examiner les piles d'exécution, identifier les modèles d'erreurs et implémenter des correctifs pour les erreurs au niveau de l'application.

Améliorer l'observabilité du système

Concevoir et implémenter des solutions complètes de suivi d'erreurs, de surveillance et d'alerte pour une meilleure détection des incidents.

Essayez ces prompts

Analyse d'erreur de base

Analysez ce message d'erreur et cette pile d'exécution. Identifiez la cause probable et suggérez un correctif : $ERROR_MESSAGE

Débogage de système distribué

Déboguez cette erreur de système distribué. L'erreur s'est produite dans le service $SERVICE_NAME avec l'ID de trace $TRACE_ID. Examinez la trace distribuée et identifiez quel service en amont a provoqué l'échec.

Examen post-incident

Effectuez un examen post-incident pour cette panne. Modèle d'erreur : $ERROR_PATTERN. Chronologie : $TIMELINE. Quels étaient les facteurs contributifs et quelles mesures préventives recommanderiez-vous ?

Implémentation de l'observabilité

Concevez une implémentation d'observabilité pour une application Node.js/Express. Incluez la configuration du suivi d'erreurs avec Sentry, le traçage distribué avec OpenTelemetry et des règles d'alerte pour les erreurs critiques.

Bonnes pratiques

Toujours corréler les erreurs avec les déploiements, les changements de configuration et les événements externes
Implémenter une journalisation structurée avec des IDs de corrélation pour le traçage distribué
Créer une logique de nouvelle tentative avec backoff exponentiel pour les échecs transitoires
Établir des budgets d'erreur et des seuils d'alerte basés sur l'impact utilisateur

Éviter

Ignorer les erreurs intermittentes - elles indiquent souvent des problèmes systémiques
Implémenter une gestion d'erreurs générique sans récupération spécifique au contexte
Envoyer des données d'erreur brutes à des systèmes externes sans éliminer les informations sensibles
Définir des seuils d'alerte trop bas, causant la fatigue d'alerte

Foire aux questions

Quelles informations dois-je fournir pour une analyse d'erreur efficace ?

Fournissez le message d'erreur complet, la pile d'exécution complète, les horodatages, les noms de services affectés, l'historique de déploiement récent et tout extrait de journal pertinent.

Comment déboguer les erreurs dans un système distribué ?

Utilisez des IDs de corrélation pour tracer les requêtes à travers les services, examinez les données de traçage distribué, identifiez le point de défaillance et remontez en arrière pour trouver la cause racine.

Quels outils d'observabilité cette compétence prend-elle en charge ?

La compétence couvre Sentry, DataDog, OpenTelemetry, Prometheus, Grafana, Jaeger et d'autres plateformes d'observabilité majeures.

Cette compétence peut-elle aider à implémenter le suivi d'erreurs ?

Oui, le guide d'implémentation inclut des exemples de code pour Sentry, DataDog et d'autres intégrations SDK de suivi d'erreurs.

Comment prioriser les erreurs pour la correction ?

Priorisez par impact utilisateur, fréquence d'erreur, sévérité et si l'erreur indique un problème systémique ou une défaillance ponctuelle.

Quelle est la stratégie de gestion d'erreurs recommandée ?

Implémentez une défense en profondeur : logique de nouvelle tentative avec backoff, disjoncteurs, propagation appropriée des erreurs, journalisation complète et alerte automatisée.

Détails du développeur

Auteur

sickn33

Licence

MIT

Dépôt

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/error-diagnostics-error-analysis

Réf

main

Structure de fichiers

📁 resources/

📄 implementation-playbook.md

📄 SKILL.md