📊

scikit-survival

Name: scikit-survival
Author: K-Dense-AI

Sûr ⚡ Contient des scripts⚙️ Commandes externes🌐 Accès réseau

Analyser des données de survie avec scikit-survival

Également disponible depuis: davila7

L'analyse de survie gère des données où les événements peuvent ne pas s'être produits pour tous les sujets. Cette compétence fournit des outils Python pour la modélisation temps-événement avec des données censurées utilisant des modèles de Cox, des Random Survival Forests, des SVM et des métriques d'évaluation spécialisées comme l'indice de concordance.

Prend en charge: Claude Codex Code(CC)

📊 71 Adéquat

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "scikit-survival". Construire un modèle de survie pour le jeu de données du cancer du poumon des vétérans et évaluer les performances

Résultat attendu:

Chargé le jeu de données veterans_lung_cancer avec 137 patients
Taux de censure : 8,0% (11 événements, 126 censurés)
CoxPHSurvivalAnalysis ajusté avec concordance_index_ipcw = 0,73
Principaux facteurs de risque : score de Karnofsky (HR=0,96), âge (HR=1,02)
AUC dépendante du temps à 180 jours : 0,81

Utilisation de "scikit-survival". Comparer Random Survival Forest et modèle Cox sur les données du cancer du sein GBSG2

Résultat attendu:

Chargé le jeu de données GBSG2 avec 2238 patients, 1548 événements
RandomSurvivalForest C-index : 0,68 (5-fold CV)
CoxPHSurvivalAnalysis C-index : 0,66 (5-fold CV)
RSF a sélectionné 12/7 caractéristiques par importance de permutation
Recommandation : RSF fournit une capacité de classement légèrement meilleure

Audit de sécurité

Sûr

v4 • 1/17/2026

All 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.

Fichiers analysés

3,958

Lignes analysées

résultats

Total des audits

Facteurs de risque

⚡ Contient des scripts (2)

SKILL.md:372-380 SKILL.md:383-387

⚙️ Commandes externes (3)

SKILL.md:39-40 references/competing-risks.md:46-70 references/data-handling.md:11-20

🌐 Accès réseau (1)

SKILL.md:357-360

Audité par: claude Voir l’historique des audits →

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Prédiction de survie des patients

Analyser les données d'essais cliniques pour prédire les probabilités de survie des patients et identifier les facteurs de risque d'événements indésirables.

Apprentissage automatique temps-événement

Construire et comparer plusieurs modèles de survie incluant Cox, Random Survival Forest et SVM pour la maintenance prédictive ou l'attrition client.

Modélisation de la progression de la maladie

Étudier des données temps-événement avec des risques concurrents comme le décès de différentes causes dans les études de progression de la maladie.

Essayez ces prompts

Analyse de survie de base

Utiliser scikit-survival pour charger le jeu de données du cancer du sein, le diviser en ensembles d'entraînement et de test, ajuster un modèle de Cox à risques proportionnels et évaluer avec l'indice de concordance d'Uno.

Comparaison de modèles

Comparer CoxPHSurvivalAnalysis, RandomSurvivalForest, GradientBoostingSurvivalAnalysis et FastSurvivalSVM sur le jeu de données GBSG2 par validation croisée avec scoring par indice de concordance.

Sélection de caractéristiques

Utiliser CoxnetSurvivalAnalysis avec régularisation elastic net pour effectuer une sélection de caractéristiques sur des données de survie haute dimension, puis identifier quelles caractéristiques ont été sélectionnées.

Risques concurrents

Démontrer l'analyse des risques concurrents en utilisant cumulative_incidence_competing_risks. Montrer comment estimer l'incidence cumulée pour différents types d'événements et comparer entre les groupes de traitement.

Bonnes pratiques

Toujours standardiser les caractéristiques pour les SVM et les modèles de Cox régularisés avant l'ajustement
Utiliser le C-index d'Uno (concordance_index_ipcw) plutôt que celui de Harrell lorsque la censure dépasse 40%
Signaler plusieurs métriques d'évaluation incluant le C-index, le score de Brier intégré et l'AUC dépendante du temps

Éviter

Utiliser l'estimateur de Kaplan-Meier lorsque des risques concurrents sont présents (utiliser l'incidence cumulée à la place)
Utiliser l'importance des caractéristiques intégrée pour les Random Survival Forests (utiliser l'importance de permutation)
Ne pas vérifier l'hypothèse de risques proportionnels pour les modèles de Cox avant l'interprétation

Foire aux questions

Quelle est la différence entre le C-index de Harrell et celui d'Uno ?

Le C-index de Harrell fonctionne bien avec une faible censure (<40%). Celui d'Uno utilise une pondération IPCW et reste non biaisé avec une censure élevée.

Comment gérer les risques concurrents ?

Utiliser cumulative_incidence_competing_risks pour l'estimation ou ajuster des modèles de Cox spécifiques à chaque cause pour chaque type d'événement.

Quel modèle dois-je choisir pour les données haute dimension ?

Utiliser CoxnetSurvivalAnalysis avec régularisation elastic net pour la sélection de caractéristiques dans les contextes haute dimension.

Comment évaluer l'étalonnage du modèle ?

Utiliser integrated_brier_score pour évaluer à la fois la discrimination et l'étalonnage. Des scores plus faibles indiquent des prédictions mieux étalonnées.

Puis-je utiliser scikit-survival avec les pipelines scikit-learn ?

Oui, les modèles scikit-survival sont compatibles avec sklearn Pipeline, GridSearchCV et cross_val_score.

Quel prétraitement est requis pour les données de survie ?

Convertir les données en objet Surv, gérer les valeurs manquantes, encoder les variables catégorielles et standardiser les caractéristiques pour les SVM.