المهارات data-scientist
📊

data-scientist

آمن

Expert Data Scientist

Besoin d'une expertise avisée en analyse de données, modèles de machine learning et modélisation statistique. Cette compétence fournit un persona de data scientist professionnel qui aide activement dans les tâches d'analyse complexe, de modélisation prédictive et d'intelligence d'affaires.

يدعم: Claude Codex Code(CC)
🥉 75 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "data-scientist". Analyze customer churn and build a predictive model

النتيجة المتوقعة:

## Approche d'Analyse du Churn

### 1. Analyse Exploratoire des Données
- Distribution des features clés (ancienneté, usage, facturation)
- Analyse de corrélation entre prédicteurs et churn
- Taux de churn spécifiques par segment

### 2. Modèle Recommandé
- Algorithme : XGBoost avec équilibrage des classes
- Features : 15-20 features ingénierées du cycle de vie client
- Validation : validation croisée 5-fold avec AUC-ROC

### 3. Prédicteurs Clés (analyse SHAP)
- Type de contrat (plus fort prédicteur)
- Charges mensuelles
- Durée d'ancienneté
- Mode de paiement

### 4. Insights Exploitables
- Cibler les clients avec contrats mois à mois
- Offrir des incitations à la marque des 12 mois d'ancienneté
- Surveiller étroitement les clients à charges élevées

استخدام "data-scientist". Design an A/B test for website checkout flow

النتيجة المتوقعة:

## Conception du Test A/B

### Hypothèse
Le nouveau flux de checkout augmentera le taux de conversion de 5%

### Calcul de Taille d'Échantillon
- Taux de conversion de base : 3%
- Effet minimal détectable : 5%
- Puissance statistique : 80%
- Niveau de signification : 5%
- Échantillon requis : ~25 000 par variante

### Randomisation
- Unité de randomisation : user_id
- Stratification par source de trafic
- Assurer une allocation égale

### Métriques
- Primaire : taux de conversion
- Secondaire : revenu par utilisateur, abandon de panier
- Guardrail : temps de chargement de page

### Plan d'Analyse
- Test z à deux proportions
- Intervalles de confiance
- Limites de surveillance séquentielle

التدقيق الأمني

آمن
v1 • 2/24/2026

Prompt-only skill containing only expertise instructions for AI behavior. No executable code, no file system access, no network requests, and no external commands. The SKILL.md defines a data scientist persona with capabilities across statistical analysis, ML, and business analytics. Static analysis scanned 0 files with 0 issues detected. This is a safe, read-only prompt skill.

0
الملفات التي تم فحصها
0
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
50
المجتمع
100
الأمان
100
الامتثال للمواصفات

ماذا يمكنك بناءه

Créer un Modèle Prédictif de Churn Client

Analyser les données client pour identifier les patterns de churn et construire un modèle prédictif pour identifier les clients à risque avec des recommandations de rétention exploitables.

Concevoir et Analyser un Test A/B

Concevoir des expériences contrôlées randomisées, déterminer les tailles d'échantillon par analyse de puissance, et analyser correctement les résultats avec des tests de signification statistique.

Créer un Système de Prévision de Demande

Construire des modèles de prévision de séries temporelles utilisant ARIMA, Prophet ou approches deep learning pour la planification des stocks et l'optimisation de la supply chain.

جرّب هذه الموجهات

Demande d'Analyse de Données Basique
Aidez-moi à analyser ce dataset. Quels sont les patterns clés, distributions et corrélations ? Fournissez des résumés statistiques et insights initiaux.
Développement de Modèle Machine Learning
Je dois construire un modèle prédictif pour [résultat spécifique]. Les données incluent [décrire les features]. Recommandez des algorithmes appropriés, aidez-moi avec le feature engineering, et guidez-moi dans la sélection et validation du modèle.
Conception d'Expérience Statistique
Concevez un test A/B pour [fonctionnalité/traitement]. Comment dois-je déterminer la taille d'échantillon ? Quelles méthodes statistiques dois-je utiliser pour l'analyse ? Comment dois-je prendre en compte les comparaisons multiples ?
Visualisation de Données et Rapport
Créez des visualisations pour [analyse spécifique]. Le public est [technique/non technique]. Quels types de graphiques sont les plus efficaces ? Aidez-moi à raconter une histoire de données convaincante.

أفضل الممارسات

  • Toujours valider les hypothèses avant d'appliquer des méthodes statistiques - vérifier la normalité, indépendance et homoscédasticité
  • Communiquer clairement l'incertitude en utilisant des intervalles de confiance et p-values plutôt que seulement la signification statistique
  • Commencer simple avec des modèles de base avant passer à des approches complexes - documenter pourquoi des méthodes plus sophistiquées sont nécessaires

تجنب

  • Utiliser des modèles ML complexes quand des méthodes statistiques simples suffisent - sur-ingénierie ajoute une complexité inutile
  • Ignorer les problèmes de qualité des données et passer directement à la modélisation sans EDA appropriée
  • Rapporter les résultats sans considérer la signification pratique - la signification statistique n'équivaut pas toujours à la valeur business

الأسئلة المتكررة

Quels langages de programmation cette compétence prend-elle en charge ?
La compétence fournit une expertise en Python (pandas, scikit-learn, PyTorch, TensorFlow), R (dplyr, ggplot2, caret), SQL et plateformes cloud comme AWS SageMaker et GCP Vertex AI.
Cette compétence peut-elle aider avec la visualisation de données ?
Oui. La compétence couvre matplotlib, seaborn, plotly et tableaux de bord interactifs avec Streamlit, Dash et Tableau. Elle enseigne également des techniques de narration de données pour différents types de publics.
Cette compétence couvre-t-elle le deep learning ?
Oui. Elle inclut les réseaux de neurones, CNNs, RNNs, LSTMs et transformers utilisant PyTorch et TensorFlow, ainsi que des cas d'usage comme NLP, vision par ordinateur et séries temporelles.
Cette compétence peut-elle aider avec l'inférence causale ?
Oui. La compétence couvre les différences-in-différences, variables instrumentales, appariement par score de propension et machine learning causal pour déterminer les effets de traitement.
Comment cette compétence gère-t-elle l'interprétabilité des modèles ?
Elle inclut les valeurs SHAP, LIME, attribution de features et graphiques de dépendance partielle pour expliquer les prédictions du modèle aux parties prenantes business.
Cette compétence peut-elle aider avec l'analyse business ?
Oui. Elle couvre l'analyse marketing (CLV, attribution, MMM), l'analyse financière (risque de crédit, détection de fraude) et l'analyse des opérations (supply chain, maintenance prédictive).

تفاصيل المطور

المؤلف

sickn33

الترخيص

MIT

مرجع

main

بنية الملفات

📄 SKILL.md