Habilidades scikit-survival
📊

scikit-survival

Seguro ⚡ Contém scripts⚙️ Comandos externos🌐 Acesso à rede

Analisar dados de sobrevivência com scikit-survival

Também disponível em: davila7

A análise de sobrevivência trata dados onde eventos podem não ter ocorrido para todos os sujeitos. Esta skill fornece ferramentas Python para modelagem de tempo-até-evento com dados censurados usando modelos Cox, Random Survival Forests, SVMs, e métricas especializadas como o índice de concordância.

Suporta: Claude Codex Code(CC)
📊 71 Adequado
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "scikit-survival". Construir um modelo de sobrevivência para o dataset de câncer de pulmão de veteranos e avaliar o desempenho

Resultado esperado:

  • Carregado dataset veterans_lung_cancer com 137 pacientes
  • Taxa de censura: 8,0% (11 eventos, 126 censurados)
  • Ajustado CoxPHSurvivalAnalysis com concordance_index_ipcw = 0,73
  • Principais fatores de risco: Karnofsky score (HR=0,96), idade (HR=1,02)
  • AUC dependente de tempo aos 180 dias: 0,81

A utilizar "scikit-survival". Comparar Random Survival Forest e modelo Cox nos dados de câncer de mama GBSG2

Resultado esperado:

  • Carregado dataset GBSG2 com 2238 pacientes, 1548 eventos
  • RandomSurvivalForest C-index: 0,68 (5-fold CV)
  • CoxPHSurvivalAnalysis C-index: 0,66 (5-fold CV)
  • RSF selecionou 12/7 características via importância de permutação
  • Recomendação: RSF fornece capacidade de ranking ligeiramente melhor

Auditoria de Segurança

Seguro
v4 • 1/17/2026

All 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.

8
Arquivos analisados
3,958
Linhas analisadas
3
achados
4
Total de auditorias
Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

45
Arquitetura
100
Manutenibilidade
87
Conteúdo
21
Comunidade
100
Segurança
91
Conformidade com especificações

O Que Você Pode Construir

Previsão de sobrevivência de pacientes

Analisar dados de ensaios clínicos para prever probabilidades de sobrevivência de pacientes e identificar fatores de risco para resultados adversos.

Aprendizado de máquina tempo-até-evento

Construir e comparar múltiplos modelos de sobrevivência incluindo Cox, Random Survival Forest e SVM para manutenção preditiva ou churn de clientes.

Modelagem de progressão de doença

Estudar dados tempo-até-evento com riscos competitivos como morte por diferentes causas em estudos de progressão de doença.

Tente Estes Prompts

Análise de sobrevivência básica
Usar scikit-survival para carregar o dataset de câncer de mama, dividi-lo em conjuntos de treino e teste, ajustar um modelo de Riscos Proporcionais de Cox e avaliar usando o índice de concordância de Uno.
Comparação de modelos
Comparar CoxPHSurvivalAnalysis, RandomSurvivalForest, GradientBoostingSurvivalAnalysis e FastSurvivalSVM no dataset GBSG2 usando validação cruzada com pontuação do índice de concordância.
Seleção de características
Usar CoxnetSurvivalAnalysis com regularização elastic net para realizar seleção de características em dados de sobrevivência de alta dimensionalidade, e então identificar quais características foram selecionadas.
Riscos competitivos
Demonstrar análise de riscos competitivos usando cumulative_incidence_competing_risks. Mostrar como estimar incidência cumulativa para diferentes tipos de eventos e comparar entre grupos de tratamento.

Melhores Práticas

  • Sempre padronizar características para SVMs e modelos Cox regularizados antes do ajuste
  • Usar C-index de Uno (concordance_index_ipcw) em vez de Harrell's quando a censura excede 40%
  • Reportar múltiplas métricas de avaliação incluindo C-index, score de Brier integrado e AUC dependente de tempo

Evitar

  • Usar estimador de Kaplan-Meier quando riscos competitivos estão presentes (usar incidência cumulativa)
  • Usar importância de características integrada para Random Survival Forests (usar importância de permutação)
  • Não verificar a suposição de riscos proporcionais para modelos Cox antes da interpretação

Perguntas Frequentes

Qual é a diferença entre o C-index de Harrell e o de Uno?
O C-index de Harrell funciona bem com baixa censura (<40%). O de Uno usa ponderação IPCW e permanece não viesado com alta censura.
Como lidar com riscos competitivos?
Usar cumulative_incidence_competing_risks para estimativa ou ajustar modelos Cox específicos por causa para cada tipo de evento.
Qual modelo devo escolher para dados de alta dimensionalidade?
Usar CoxnetSurvivalAnalysis com regularização elastic net para seleção de características em configurações de alta dimensionalidade.
Como avaliar a calibração do modelo?
Usar integrated_brier_score para avaliar tanto discriminação quanto calibração. Scores menores indicam previsões melhor calibradas.
Posso usar scikit-survival com pipelines scikit-learn?
Sim, modelos scikit-survival são compatíveis com sklearn Pipeline, GridSearchCV e cross_val_score.
Qual pré-processamento é necessário para dados de sobrevivência?
Converter dados para objeto Surv, tratar valores faltantes, codificar variáveis categóricas e padronizar características para SVMs.

Detalhes do Desenvolvedor