scikit-survival
Analisar dados de sobrevivência com scikit-survival
Também disponível em: davila7
A análise de sobrevivência trata dados onde eventos podem não ter ocorrido para todos os sujeitos. Esta skill fornece ferramentas Python para modelagem de tempo-até-evento com dados censurados usando modelos Cox, Random Survival Forests, SVMs, e métricas especializadas como o índice de concordância.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "scikit-survival". Construir um modelo de sobrevivência para o dataset de câncer de pulmão de veteranos e avaliar o desempenho
Resultado esperado:
- Carregado dataset veterans_lung_cancer com 137 pacientes
- Taxa de censura: 8,0% (11 eventos, 126 censurados)
- Ajustado CoxPHSurvivalAnalysis com concordance_index_ipcw = 0,73
- Principais fatores de risco: Karnofsky score (HR=0,96), idade (HR=1,02)
- AUC dependente de tempo aos 180 dias: 0,81
A utilizar "scikit-survival". Comparar Random Survival Forest e modelo Cox nos dados de câncer de mama GBSG2
Resultado esperado:
- Carregado dataset GBSG2 com 2238 pacientes, 1548 eventos
- RandomSurvivalForest C-index: 0,68 (5-fold CV)
- CoxPHSurvivalAnalysis C-index: 0,66 (5-fold CV)
- RSF selecionou 12/7 características via importância de permutação
- Recomendação: RSF fornece capacidade de ranking ligeiramente melhor
Auditoria de Segurança
SeguroAll 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.
Fatores de risco
⚡ Contém scripts (2)
⚙️ Comandos externos (3)
🌐 Acesso à rede (1)
Pontuação de qualidade
O Que Você Pode Construir
Previsão de sobrevivência de pacientes
Analisar dados de ensaios clínicos para prever probabilidades de sobrevivência de pacientes e identificar fatores de risco para resultados adversos.
Aprendizado de máquina tempo-até-evento
Construir e comparar múltiplos modelos de sobrevivência incluindo Cox, Random Survival Forest e SVM para manutenção preditiva ou churn de clientes.
Modelagem de progressão de doença
Estudar dados tempo-até-evento com riscos competitivos como morte por diferentes causas em estudos de progressão de doença.
Tente Estes Prompts
Usar scikit-survival para carregar o dataset de câncer de mama, dividi-lo em conjuntos de treino e teste, ajustar um modelo de Riscos Proporcionais de Cox e avaliar usando o índice de concordância de Uno.
Comparar CoxPHSurvivalAnalysis, RandomSurvivalForest, GradientBoostingSurvivalAnalysis e FastSurvivalSVM no dataset GBSG2 usando validação cruzada com pontuação do índice de concordância.
Usar CoxnetSurvivalAnalysis com regularização elastic net para realizar seleção de características em dados de sobrevivência de alta dimensionalidade, e então identificar quais características foram selecionadas.
Demonstrar análise de riscos competitivos usando cumulative_incidence_competing_risks. Mostrar como estimar incidência cumulativa para diferentes tipos de eventos e comparar entre grupos de tratamento.
Melhores Práticas
- Sempre padronizar características para SVMs e modelos Cox regularizados antes do ajuste
- Usar C-index de Uno (concordance_index_ipcw) em vez de Harrell's quando a censura excede 40%
- Reportar múltiplas métricas de avaliação incluindo C-index, score de Brier integrado e AUC dependente de tempo
Evitar
- Usar estimador de Kaplan-Meier quando riscos competitivos estão presentes (usar incidência cumulativa)
- Usar importância de características integrada para Random Survival Forests (usar importância de permutação)
- Não verificar a suposição de riscos proporcionais para modelos Cox antes da interpretação
Perguntas Frequentes
Qual é a diferença entre o C-index de Harrell e o de Uno?
Como lidar com riscos competitivos?
Qual modelo devo escolher para dados de alta dimensionalidade?
Como avaliar a calibração do modelo?
Posso usar scikit-survival com pipelines scikit-learn?
Qual pré-processamento é necessário para dados de sobrevivência?
Detalhes do Desenvolvedor
Autor
K-Dense-AILicença
GPL-3.0 license
Repositório
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/scikit-survivalReferência
main
Estrutura de arquivos