scikit-survival
Analyser des données de survie avec scikit-survival
Également disponible depuis: davila7
L'analyse de survie gère des données où les événements peuvent ne pas s'être produits pour tous les sujets. Cette compétence fournit des outils Python pour la modélisation temps-événement avec des données censurées utilisant des modèles de Cox, des Random Survival Forests, des SVM et des métriques d'évaluation spécialisées comme l'indice de concordance.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "scikit-survival". Construire un modèle de survie pour le jeu de données du cancer du poumon des vétérans et évaluer les performances
Résultat attendu:
- Chargé le jeu de données veterans_lung_cancer avec 137 patients
- Taux de censure : 8,0% (11 événements, 126 censurés)
- CoxPHSurvivalAnalysis ajusté avec concordance_index_ipcw = 0,73
- Principaux facteurs de risque : score de Karnofsky (HR=0,96), âge (HR=1,02)
- AUC dépendante du temps à 180 jours : 0,81
Utilisation de "scikit-survival". Comparer Random Survival Forest et modèle Cox sur les données du cancer du sein GBSG2
Résultat attendu:
- Chargé le jeu de données GBSG2 avec 2238 patients, 1548 événements
- RandomSurvivalForest C-index : 0,68 (5-fold CV)
- CoxPHSurvivalAnalysis C-index : 0,66 (5-fold CV)
- RSF a sélectionné 12/7 caractéristiques par importance de permutation
- Recommandation : RSF fournit une capacité de classement légèrement meilleure
Audit de sécurité
SûrAll 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.
Facteurs de risque
⚡ Contient des scripts (2)
⚙️ Commandes externes (3)
🌐 Accès réseau (1)
Score de qualité
Ce que vous pouvez construire
Prédiction de survie des patients
Analyser les données d'essais cliniques pour prédire les probabilités de survie des patients et identifier les facteurs de risque d'événements indésirables.
Apprentissage automatique temps-événement
Construire et comparer plusieurs modèles de survie incluant Cox, Random Survival Forest et SVM pour la maintenance prédictive ou l'attrition client.
Modélisation de la progression de la maladie
Étudier des données temps-événement avec des risques concurrents comme le décès de différentes causes dans les études de progression de la maladie.
Essayez ces prompts
Utiliser scikit-survival pour charger le jeu de données du cancer du sein, le diviser en ensembles d'entraînement et de test, ajuster un modèle de Cox à risques proportionnels et évaluer avec l'indice de concordance d'Uno.
Comparer CoxPHSurvivalAnalysis, RandomSurvivalForest, GradientBoostingSurvivalAnalysis et FastSurvivalSVM sur le jeu de données GBSG2 par validation croisée avec scoring par indice de concordance.
Utiliser CoxnetSurvivalAnalysis avec régularisation elastic net pour effectuer une sélection de caractéristiques sur des données de survie haute dimension, puis identifier quelles caractéristiques ont été sélectionnées.
Démontrer l'analyse des risques concurrents en utilisant cumulative_incidence_competing_risks. Montrer comment estimer l'incidence cumulée pour différents types d'événements et comparer entre les groupes de traitement.
Bonnes pratiques
- Toujours standardiser les caractéristiques pour les SVM et les modèles de Cox régularisés avant l'ajustement
- Utiliser le C-index d'Uno (concordance_index_ipcw) plutôt que celui de Harrell lorsque la censure dépasse 40%
- Signaler plusieurs métriques d'évaluation incluant le C-index, le score de Brier intégré et l'AUC dépendante du temps
Éviter
- Utiliser l'estimateur de Kaplan-Meier lorsque des risques concurrents sont présents (utiliser l'incidence cumulée à la place)
- Utiliser l'importance des caractéristiques intégrée pour les Random Survival Forests (utiliser l'importance de permutation)
- Ne pas vérifier l'hypothèse de risques proportionnels pour les modèles de Cox avant l'interprétation
Foire aux questions
Quelle est la différence entre le C-index de Harrell et celui d'Uno ?
Comment gérer les risques concurrents ?
Quel modèle dois-je choisir pour les données haute dimension ?
Comment évaluer l'étalonnage du modèle ?
Puis-je utiliser scikit-survival avec les pipelines scikit-learn ?
Quel prétraitement est requis pour les données de survie ?
Détails du développeur
Auteur
K-Dense-AILicence
GPL-3.0 license
Dépôt
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/scikit-survivalRéf
main
Structure de fichiers