scikit-survival
Анализируйте данные выживаемости с помощью scikit-survival
Также доступно от: davila7
Анализ выживаемости работает с данными, в которых события могли не произойти для всех субъектов. Этот навык предоставляет инструменты Python для моделирования времени до события с цензурированными данными с использованием моделей Кокса, случайных лесов выживаемости, SVM и специализированных метрик оценки, таких как индекс конкордантности.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «scikit-survival». Build a survival model for the veterans lung cancer dataset and evaluate performance
Ожидаемый результат:
- Loaded veterans_lung_cancer dataset with 137 patients
- Censoring rate: 8.0% (11 events, 126 censored)
- Fitted CoxPHSurvivalAnalysis with concordance_index_ipcw = 0.73
- Top risk factors: Karnofsky score (HR=0.96), age (HR=1.02)
- Time-dependent AUC at 180 days: 0.81
Использование «scikit-survival». Compare Random Survival Forest and Cox model on GBSG2 breast cancer data
Ожидаемый результат:
- Loaded GBSG2 dataset with 2238 patients, 1548 events
- RandomSurvivalForest C-index: 0.68 (5-fold CV)
- CoxPHSurvivalAnalysis C-index: 0.66 (5-fold CV)
- RSF selected 12/7 features via permutation importance
- Recommendation: RSF provides slightly better ranking ability
Аудит безопасности
БезопасноAll 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.
Факторы риска
⚡ Содержит скрипты (2)
⚙️ Внешние команды (3)
🌐 Доступ к сети (1)
Оценка качества
Что вы можете построить
Прогноз выживаемости пациентов
Анализировать данные клинических испытаний для прогнозирования вероятностей выживания пациентов и выявления факторов риска неблагоприятных исходов.
Машинное обучение для времени до события
Строить и сравнивать несколько моделей выживаемости, включая Кокса, Random Survival Forest и SVM, для предиктивного обслуживания или оттока клиентов.
Моделирование прогрессирования болезни
Изучать данные времени до события с конкурирующими рисками, такими как смерть от разных причин, в исследованиях прогрессирования заболевания.
Попробуйте эти промпты
Use scikit-survival to load the breast cancer dataset, split it into train and test sets, fit a Cox Proportional Hazards model, and evaluate using Uno's concordance index.
Compare CoxPHSurvivalAnalysis, RandomSurvivalForest, GradientBoostingSurvivalAnalysis, and FastSurvivalSVM on the GBSG2 dataset using cross-validation with concordance index scoring.
Use CoxnetSurvivalAnalysis with elastic net regularization to perform feature selection on high-dimensional survival data, then identify which features were selected.
Demonstrate competing risks analysis using cumulative_incidence_competing_risks. Show how to estimate cumulative incidence for different event types and compare between treatment groups.
Лучшие практики
- Всегда стандартизируйте признаки для SVM и регуляризованных моделей Кокса перед обучением
- Используйте C-index Uno (concordance_index_ipcw) вместо Harrell, когда цензурирование превышает 40%
- Сообщайте несколько метрик оценки, включая C-index, integrated Brier score и time-dependent AUC
Избегать
- Использование оценивателя Kaplan-Meier при наличии конкурирующих рисков (вместо этого используйте кумулятивную инцидентность)
- Использование встроенной важности признаков для Random Survival Forests (используйте permutation importance)
- Отсутствие проверки предположения о пропорциональных рисках для моделей Кокса перед интерпретацией
Часто задаваемые вопросы
В чем разница между C-index Harrell и Uno?
Как обрабатывать конкурирующие риски?
Какую модель выбрать для высокоразмерных данных?
Как оценивать калибровку модели?
Можно ли использовать scikit-survival с пайплайнами scikit-learn?
Какая предобработка требуется для данных выживаемости?
Сведения для разработчиков
Автор
K-Dense-AIЛицензия
GPL-3.0 license
Репозиторий
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/scikit-survivalСсылка
main
Структура файлов