📊

scikit-survival

Name: scikit-survival
Author: K-Dense-AI

Безопасно ⚡ Содержит скрипты⚙️ Внешние команды🌐 Доступ к сети

Анализируйте данные выживаемости с помощью scikit-survival

Также доступно от: davila7

Анализ выживаемости работает с данными, в которых события могли не произойти для всех субъектов. Этот навык предоставляет инструменты Python для моделирования времени до события с цензурированными данными с использованием моделей Кокса, случайных лесов выживаемости, SVM и специализированных метрик оценки, таких как индекс конкордантности.

Поддерживает: Claude Codex Code(CC)

📊 71 Адекватно

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «scikit-survival». Build a survival model for the veterans lung cancer dataset and evaluate performance

Ожидаемый результат:

Loaded veterans_lung_cancer dataset with 137 patients
Censoring rate: 8.0% (11 events, 126 censored)
Fitted CoxPHSurvivalAnalysis with concordance_index_ipcw = 0.73
Top risk factors: Karnofsky score (HR=0.96), age (HR=1.02)
Time-dependent AUC at 180 days: 0.81

Использование «scikit-survival». Compare Random Survival Forest and Cox model on GBSG2 breast cancer data

Ожидаемый результат:

Loaded GBSG2 dataset with 2238 patients, 1548 events
RandomSurvivalForest C-index: 0.68 (5-fold CV)
CoxPHSurvivalAnalysis C-index: 0.66 (5-fold CV)
RSF selected 12/7 features via permutation importance
Recommendation: RSF provides slightly better ranking ability

Аудит безопасности

Безопасно

v4 • 1/17/2026

All 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.

Просканировано файлов

3,958

Проанализировано строк

находки

Всего аудитов

Факторы риска

⚡ Содержит скрипты (2)

SKILL.md:372-380 SKILL.md:383-387

⚙️ Внешние команды (3)

SKILL.md:39-40 references/competing-risks.md:46-70 references/data-handling.md:11-20

🌐 Доступ к сети (1)

SKILL.md:357-360

Проверено: claude Посмотреть историю аудитов →

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

100

Безопасность

Соответствие спецификации

Что вы можете построить

Прогноз выживаемости пациентов

Анализировать данные клинических испытаний для прогнозирования вероятностей выживания пациентов и выявления факторов риска неблагоприятных исходов.

Машинное обучение для времени до события

Строить и сравнивать несколько моделей выживаемости, включая Кокса, Random Survival Forest и SVM, для предиктивного обслуживания или оттока клиентов.

Моделирование прогрессирования болезни

Изучать данные времени до события с конкурирующими рисками, такими как смерть от разных причин, в исследованиях прогрессирования заболевания.

Попробуйте эти промпты

Базовый анализ выживаемости

Use scikit-survival to load the breast cancer dataset, split it into train and test sets, fit a Cox Proportional Hazards model, and evaluate using Uno's concordance index.

Сравнение моделей

Compare CoxPHSurvivalAnalysis, RandomSurvivalForest, GradientBoostingSurvivalAnalysis, and FastSurvivalSVM on the GBSG2 dataset using cross-validation with concordance index scoring.

Отбор признаков

Use CoxnetSurvivalAnalysis with elastic net regularization to perform feature selection on high-dimensional survival data, then identify which features were selected.

Конкурирующие риски

Demonstrate competing risks analysis using cumulative_incidence_competing_risks. Show how to estimate cumulative incidence for different event types and compare between treatment groups.

Лучшие практики

Всегда стандартизируйте признаки для SVM и регуляризованных моделей Кокса перед обучением
Используйте C-index Uno (concordance_index_ipcw) вместо Harrell, когда цензурирование превышает 40%
Сообщайте несколько метрик оценки, включая C-index, integrated Brier score и time-dependent AUC

Избегать

Использование оценивателя Kaplan-Meier при наличии конкурирующих рисков (вместо этого используйте кумулятивную инцидентность)
Использование встроенной важности признаков для Random Survival Forests (используйте permutation importance)
Отсутствие проверки предположения о пропорциональных рисках для моделей Кокса перед интерпретацией

Часто задаваемые вопросы

В чем разница между C-index Harrell и Uno?

C-index Harrell хорошо работает при низком цензурировании (<40%). Uno использует взвешивание IPCW и остается несмещенным при высоком цензурировании.

Как обрабатывать конкурирующие риски?

Используйте cumulative_incidence_competing_risks для оценки или обучайте отдельные cause-specific модели Кокса для каждого типа события.

Какую модель выбрать для высокоразмерных данных?

Используйте CoxnetSurvivalAnalysis с регуляризацией elastic net для отбора признаков в высокоразмерных задачах.

Как оценивать калибровку модели?

Используйте integrated_brier_score для оценки дискриминации и калибровки. Более низкие значения указывают на лучшую калибровку прогнозов.

Можно ли использовать scikit-survival с пайплайнами scikit-learn?

Да, модели scikit-survival совместимы с sklearn Pipeline, GridSearchCV и cross_val_score.

Какая предобработка требуется для данных выживаемости?

Преобразуйте данные в объект Surv, обработайте пропуски, закодируйте категориальные признаки и стандартизируйте признаки для SVM.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

GPL-3.0 license

Репозиторий

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/scikit-survival

Ссылка

main

Структура файлов

📁 references/

📄 competing-risks.md

📄 cox-models.md

📄 data-handling.md

📄 ensemble-models.md

📄 evaluation-metrics.md

📄 svm-models.md

📄 SKILL.md