La création de visualisations statistiques de qualité publication nécessite un code standard significatif et des décisions de conception. Cette compétence fournit un accès optimisé aux fonctions de la bibliothèque seaborn pour générer des box plots, des violin plots, des heatmaps et des pair plots avec des paramètres par défaut attrayants et une intégration pandas.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "seaborn". Create a box plot showing revenue by region using the sales_data DataFrame. Set region as x-axis and revenue as y-axis.
Résultat attendu:
Une figure de box plot avec les régions sur l'axe des x, le chiffre d'affaires sur l'axe des y, montrant la médiane, les quartiles et les valeurs aberrantes pour chaque région. Style propre avec les paramètres par défaut de seaborn appliqués.
Utilisation de "seaborn". Generate a heatmap of the correlation matrix from customer_data with annotations showing the correlation coefficients.
Résultat attendu:
Une heatmap carrée avec des cellules colorées selon l'intensité de corrélation (palette divergente rouge-bleu), des annotations numériques dans chaque cellule, et une légende de barre de couleur montrant l'échelle.
Utilisation de "seaborn". Create a violin plot of response times by priority level from support_data, with box inside showing quartiles.
Résultat attendu:
Un violin plot avec les niveaux de priorité sur l'axe des x et les temps de réponse sur l'axe des y. Chaque violon montre la distribution complète, avec une superposition de box plot affichant les lignes de médiane et de quartiles.
Audit de sécurité
SûrAll static findings are false positives. The scanner incorrectly identified markdown documentation formatting (backticks for inline code) as shell command execution, library names as cryptographic algorithms, and standard metadata as network indicators. This is a legitimate statistical visualization skill with no malicious code or risky operations.
Score de qualité
Ce que vous pouvez construire
Explorer les distributions de données pour l'analyse
Générer rapidement des comparaisons de distributions entre groupes catégoriels à l'aide de box plots et de violin plots pour identifier les valeurs aberrantes et les modèles dans les données expérimentales ou d'enquête.
Visualiser les matrices de corrélation dans les notebooks
Créer des heatmaps annotées montrant les coefficients de corrélation entre les variables pour aider à la sélection de caractéristiques et à l'évaluation de la multicolinéarité dans les workflows de machine learning.
Générer des figures de qualité publication
Produire des figures statistiques stylisées avec une esthétique cohérente pour les articles académiques, rapports et présentations grâce à la personnalisation du thème seaborn.
Essayez ces prompts
Utiliser la compétence seaborn pour créer un box plot comparant les valeurs à travers une variable catégorielle. Utiliser le DataFrame sample_data avec 'category' comme axe des x et 'value' comme axe des y. Appliquer le thème par défaut de seaborn et ajouter des étiquettes appropriées.
Générer un violin plot avec la compétence seaborn montrant la distribution de 'scores' par 'treatment_group' à partir de experiment_data. Inclure l'option inner='box' pour afficher les quartiles. Utiliser une palette de couleurs professionnelle et définir la taille de la figure à 10x6.
Créer un heatmap utilisant seaborn pour visualiser la matrice de corrélation de features_df. Annoter les cellules avec les valeurs de corrélation, utiliser une palette divergente centrée à 0, et inclure une légende de barre de couleur. Définir la taille de figure appropriée pour la lisibilité.
Générer un pair plot utilisant seaborn pour les colonnes ['sepal_length', 'sepal_width', 'petal_length', 'petal_width'] de iris_data. Colorer les points par espèce, afficher les scatter plots sur le triangle inférieur et les distributions sur la diagonale, et utiliser une grille de sous-figures de 12x12.
Bonnes pratiques
- Utiliser des tailles de figure cohérentes (définies via les paramètres matplotlib) lors de la création de plusieurs visualisations liées pour des rapports
- Appliquer les paramètres de thème seaborn (sns.set_theme) une seule fois au début des sessions pour un style cohérent sur toutes les figures générées
- Choisir des palettes de couleurs appropriées (divergentes pour les corrélations, séquentielles pour les magnitudes) pour représenter précisément les relations de données
Éviter
- Éviter de créer des visualisations trop complexes avec trop de catégories (considérer l'agrégation ou le filtrage des données au préalable)
- Ne pas utiliser de box plots pour des échantillons de taille très petite où des violin plots ou des strip plots montreraient mieux la distribution
- Éviter de surcharger les figures avec des annotations excessives ; garder les étiquettes et titres clairs et concis
Foire aux questions
Quelle est la différence entre les box plots et les violin plots dans seaborn ?
Puis-je utiliser seaborn avec des données stockées dans des DataFrames pandas ?
Comment enregistrer des figures seaborn pour la publication ?
Quelles palettes de couleurs sont disponibles dans seaborn ?
Comment personnaliser le style des figures seaborn globalement ?
Puis-je combiner matplotlib et seaborn dans la même figure ?
Détails du développeur
Structure de fichiers