Навыки scikit-survival
📊

scikit-survival

Безопасно ⚡ Содержит скрипты⚙️ Внешние команды🌐 Доступ к сети

Анализируйте данные выживаемости с помощью scikit-survival

Также доступно от: davila7

Анализ выживаемости работает с данными, в которых события могли не произойти для всех субъектов. Этот навык предоставляет инструменты Python для моделирования времени до события с цензурированными данными с использованием моделей Кокса, случайных лесов выживаемости, SVM и специализированных метрик оценки, таких как индекс конкордантности.

Поддерживает: Claude Codex Code(CC)
📊 71 Адекватно
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «scikit-survival». Build a survival model for the veterans lung cancer dataset and evaluate performance

Ожидаемый результат:

  • Loaded veterans_lung_cancer dataset with 137 patients
  • Censoring rate: 8.0% (11 events, 126 censored)
  • Fitted CoxPHSurvivalAnalysis with concordance_index_ipcw = 0.73
  • Top risk factors: Karnofsky score (HR=0.96), age (HR=1.02)
  • Time-dependent AUC at 180 days: 0.81

Использование «scikit-survival». Compare Random Survival Forest and Cox model on GBSG2 breast cancer data

Ожидаемый результат:

  • Loaded GBSG2 dataset with 2238 patients, 1548 events
  • RandomSurvivalForest C-index: 0.68 (5-fold CV)
  • CoxPHSurvivalAnalysis C-index: 0.66 (5-fold CV)
  • RSF selected 12/7 features via permutation importance
  • Recommendation: RSF provides slightly better ranking ability

Аудит безопасности

Безопасно
v4 • 1/17/2026

All 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.

8
Просканировано файлов
3,958
Проанализировано строк
3
находки
4
Всего аудитов

Факторы риска

⚡ Содержит скрипты (2)
⚙️ Внешние команды (3)
🌐 Доступ к сети (1)

Оценка качества

45
Архитектура
100
Сопровождаемость
87
Контент
21
Сообщество
100
Безопасность
91
Соответствие спецификации

Что вы можете построить

Прогноз выживаемости пациентов

Анализировать данные клинических испытаний для прогнозирования вероятностей выживания пациентов и выявления факторов риска неблагоприятных исходов.

Машинное обучение для времени до события

Строить и сравнивать несколько моделей выживаемости, включая Кокса, Random Survival Forest и SVM, для предиктивного обслуживания или оттока клиентов.

Моделирование прогрессирования болезни

Изучать данные времени до события с конкурирующими рисками, такими как смерть от разных причин, в исследованиях прогрессирования заболевания.

Попробуйте эти промпты

Базовый анализ выживаемости
Use scikit-survival to load the breast cancer dataset, split it into train and test sets, fit a Cox Proportional Hazards model, and evaluate using Uno's concordance index.
Сравнение моделей
Compare CoxPHSurvivalAnalysis, RandomSurvivalForest, GradientBoostingSurvivalAnalysis, and FastSurvivalSVM on the GBSG2 dataset using cross-validation with concordance index scoring.
Отбор признаков
Use CoxnetSurvivalAnalysis with elastic net regularization to perform feature selection on high-dimensional survival data, then identify which features were selected.
Конкурирующие риски
Demonstrate competing risks analysis using cumulative_incidence_competing_risks. Show how to estimate cumulative incidence for different event types and compare between treatment groups.

Лучшие практики

  • Всегда стандартизируйте признаки для SVM и регуляризованных моделей Кокса перед обучением
  • Используйте C-index Uno (concordance_index_ipcw) вместо Harrell, когда цензурирование превышает 40%
  • Сообщайте несколько метрик оценки, включая C-index, integrated Brier score и time-dependent AUC

Избегать

  • Использование оценивателя Kaplan-Meier при наличии конкурирующих рисков (вместо этого используйте кумулятивную инцидентность)
  • Использование встроенной важности признаков для Random Survival Forests (используйте permutation importance)
  • Отсутствие проверки предположения о пропорциональных рисках для моделей Кокса перед интерпретацией

Часто задаваемые вопросы

В чем разница между C-index Harrell и Uno?
C-index Harrell хорошо работает при низком цензурировании (<40%). Uno использует взвешивание IPCW и остается несмещенным при высоком цензурировании.
Как обрабатывать конкурирующие риски?
Используйте cumulative_incidence_competing_risks для оценки или обучайте отдельные cause-specific модели Кокса для каждого типа события.
Какую модель выбрать для высокоразмерных данных?
Используйте CoxnetSurvivalAnalysis с регуляризацией elastic net для отбора признаков в высокоразмерных задачах.
Как оценивать калибровку модели?
Используйте integrated_brier_score для оценки дискриминации и калибровки. Более низкие значения указывают на лучшую калибровку прогнозов.
Можно ли использовать scikit-survival с пайплайнами scikit-learn?
Да, модели scikit-survival совместимы с sklearn Pipeline, GridSearchCV и cross_val_score.
Какая предобработка требуется для данных выживаемости?
Преобразуйте данные в объект Surv, обработайте пропуски, закодируйте категориальные признаки и стандартизируйте признаки для SVM.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

GPL-3.0 license

Ссылка

main

Структура файлов