📊

data-scientist

Name: data-scientist
Author: sickn33

Sûr

Expert Data Scientist

Besoin d'une expertise avisée en analyse de données, modèles de machine learning et modélisation statistique. Cette compétence fournit un persona de data scientist professionnel qui aide activement dans les tâches d'analyse complexe, de modélisation prédictive et d'intelligence d'affaires.

Prend en charge: Claude Codex Code(CC)

🥉 72 Bronze

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "data-scientist". Analyze customer churn and build a predictive model

Résultat attendu:

## Approche d'Analyse du Churn

### 1. Analyse Exploratoire des Données
- Distribution des features clés (ancienneté, usage, facturation)
- Analyse de corrélation entre prédicteurs et churn
- Taux de churn spécifiques par segment

### 2. Modèle Recommandé
- Algorithme : XGBoost avec équilibrage des classes
- Features : 15-20 features ingénierées du cycle de vie client
- Validation : validation croisée 5-fold avec AUC-ROC

### 3. Prédicteurs Clés (analyse SHAP)
- Type de contrat (plus fort prédicteur)
- Charges mensuelles
- Durée d'ancienneté
- Mode de paiement

### 4. Insights Exploitables
- Cibler les clients avec contrats mois à mois
- Offrir des incitations à la marque des 12 mois d'ancienneté
- Surveiller étroitement les clients à charges élevées

Utilisation de "data-scientist". Design an A/B test for website checkout flow

Résultat attendu:

## Conception du Test A/B

### Hypothèse
Le nouveau flux de checkout augmentera le taux de conversion de 5%

### Calcul de Taille d'Échantillon
- Taux de conversion de base : 3%
- Effet minimal détectable : 5%
- Puissance statistique : 80%
- Niveau de signification : 5%
- Échantillon requis : ~25 000 par variante

### Randomisation
- Unité de randomisation : user_id
- Stratification par source de trafic
- Assurer une allocation égale

### Métriques
- Primaire : taux de conversion
- Secondaire : revenu par utilisateur, abandon de panier
- Guardrail : temps de chargement de page

### Plan d'Analyse
- Test z à deux proportions
- Intervalles de confiance
- Limites de surveillance séquentielle

Audit de sécurité

Sûr

v1 • 2/24/2026

Prompt-only skill containing only expertise instructions for AI behavior. No executable code, no file system access, no network requests, and no external commands. The SKILL.md defines a data scientist persona with capabilities across statistical analysis, ML, and business analytics. Static analysis scanned 0 files with 0 issues detected. This is a safe, read-only prompt skill.

Fichiers analysés

Lignes analysées

résultats

Total des audits

Aucun problème de sécurité trouvé

Audité par: claude

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

100

Conformité aux spécifications

Ce que vous pouvez construire

Créer un Modèle Prédictif de Churn Client

Analyser les données client pour identifier les patterns de churn et construire un modèle prédictif pour identifier les clients à risque avec des recommandations de rétention exploitables.

Concevoir et Analyser un Test A/B

Concevoir des expériences contrôlées randomisées, déterminer les tailles d'échantillon par analyse de puissance, et analyser correctement les résultats avec des tests de signification statistique.

Créer un Système de Prévision de Demande

Construire des modèles de prévision de séries temporelles utilisant ARIMA, Prophet ou approches deep learning pour la planification des stocks et l'optimisation de la supply chain.

Essayez ces prompts

Demande d'Analyse de Données Basique

Aidez-moi à analyser ce dataset. Quels sont les patterns clés, distributions et corrélations ? Fournissez des résumés statistiques et insights initiaux.

Développement de Modèle Machine Learning

Je dois construire un modèle prédictif pour [résultat spécifique]. Les données incluent [décrire les features]. Recommandez des algorithmes appropriés, aidez-moi avec le feature engineering, et guidez-moi dans la sélection et validation du modèle.

Conception d'Expérience Statistique

Concevez un test A/B pour [fonctionnalité/traitement]. Comment dois-je déterminer la taille d'échantillon ? Quelles méthodes statistiques dois-je utiliser pour l'analyse ? Comment dois-je prendre en compte les comparaisons multiples ?

Visualisation de Données et Rapport

Créez des visualisations pour [analyse spécifique]. Le public est [technique/non technique]. Quels types de graphiques sont les plus efficaces ? Aidez-moi à raconter une histoire de données convaincante.

Bonnes pratiques

Toujours valider les hypothèses avant d'appliquer des méthodes statistiques - vérifier la normalité, indépendance et homoscédasticité
Communiquer clairement l'incertitude en utilisant des intervalles de confiance et p-values plutôt que seulement la signification statistique
Commencer simple avec des modèles de base avant passer à des approches complexes - documenter pourquoi des méthodes plus sophistiquées sont nécessaires

Éviter

Utiliser des modèles ML complexes quand des méthodes statistiques simples suffisent - sur-ingénierie ajoute une complexité inutile
Ignorer les problèmes de qualité des données et passer directement à la modélisation sans EDA appropriée
Rapporter les résultats sans considérer la signification pratique - la signification statistique n'équivaut pas toujours à la valeur business

Foire aux questions

Quels langages de programmation cette compétence prend-elle en charge ?

La compétence fournit une expertise en Python (pandas, scikit-learn, PyTorch, TensorFlow), R (dplyr, ggplot2, caret), SQL et plateformes cloud comme AWS SageMaker et GCP Vertex AI.

Cette compétence peut-elle aider avec la visualisation de données ?

Oui. La compétence couvre matplotlib, seaborn, plotly et tableaux de bord interactifs avec Streamlit, Dash et Tableau. Elle enseigne également des techniques de narration de données pour différents types de publics.

Cette compétence couvre-t-elle le deep learning ?

Oui. Elle inclut les réseaux de neurones, CNNs, RNNs, LSTMs et transformers utilisant PyTorch et TensorFlow, ainsi que des cas d'usage comme NLP, vision par ordinateur et séries temporelles.

Cette compétence peut-elle aider avec l'inférence causale ?

Oui. La compétence couvre les différences-in-différences, variables instrumentales, appariement par score de propension et machine learning causal pour déterminer les effets de traitement.

Comment cette compétence gère-t-elle l'interprétabilité des modèles ?

Elle inclut les valeurs SHAP, LIME, attribution de features et graphiques de dépendance partielle pour expliquer les prédictions du modèle aux parties prenantes business.

Cette compétence peut-elle aider avec l'analyse business ?

Oui. Elle couvre l'analyse marketing (CLV, attribution, MMM), l'analyse financière (risque de crédit, détection de fraude) et l'analyse des opérations (supply chain, maintenance prédictive).

Détails du développeur

Auteur

sickn33

Licence

MIT

Dépôt

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/data-scientist

Réf

main

Structure de fichiers

📄 SKILL.md