スキル scikit-survival
📊

scikit-survival

安全 ⚡ スクリプトを含む⚙️ 外部コマンド🌐 ネットワークアクセス

scikit-survivalで生存データを解析

こちらからも入手できます: davila7

生存解析は、すべての対象でイベントが起こるとは限らないデータを扱います。このスキルは、Coxモデル、Random Survival Forest、SVM、コンコーダンス指数などの特化評価指標を用いて、打ち切りデータの時間-to-イベントモデリングを行うためのPythonツールを提供します。

対応: Claude Codex Code(CC)
📊 71 十分
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「scikit-survival」を使用しています。 Build a survival model for the veterans lung cancer dataset and evaluate performance

期待される結果:

  • Loaded veterans_lung_cancer dataset with 137 patients
  • Censoring rate: 8.0% (11 events, 126 censored)
  • Fitted CoxPHSurvivalAnalysis with concordance_index_ipcw = 0.73
  • Top risk factors: Karnofsky score (HR=0.96), age (HR=1.02)
  • Time-dependent AUC at 180 days: 0.81

「scikit-survival」を使用しています。 Compare Random Survival Forest and Cox model on GBSG2 breast cancer data

期待される結果:

  • Loaded GBSG2 dataset with 2238 patients, 1548 events
  • RandomSurvivalForest C-index: 0.68 (5-fold CV)
  • CoxPHSurvivalAnalysis C-index: 0.66 (5-fold CV)
  • RSF selected 12/7 features via permutation importance
  • Recommendation: RSF provides slightly better ranking ability

セキュリティ監査

安全
v4 • 1/17/2026

All 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.

8
スキャンされたファイル
3,958
解析された行数
3
検出結果
4
総監査数

リスク要因

⚡ スクリプトを含む (2)
⚙️ 外部コマンド (3)
🌐 ネットワークアクセス (1)
監査者: claude 監査履歴を表示 →

品質スコア

45
アーキテクチャ
100
保守性
87
コンテンツ
21
コミュニティ
100
セキュリティ
91
仕様準拠

作れるもの

患者生存予測

臨床試験データを解析して患者の生存確率を予測し、有害転帰のリスク因子を特定します。

時間-to-イベントの機械学習

予知保全や顧客離反に向けて、Cox、Random Survival Forest、SVMを含む複数の生存モデルを構築・比較します。

疾患進行モデリング

疾患進行研究における異なる原因による死亡など、競合リスクを伴う時間-to-イベントデータを解析します。

これらのプロンプトを試す

基本的な生存解析
Use scikit-survival to load the breast cancer dataset, split it into train and test sets, fit a Cox Proportional Hazards model, and evaluate using Uno's concordance index.
モデル比較
Compare CoxPHSurvivalAnalysis, RandomSurvivalForest, GradientBoostingSurvivalAnalysis, and FastSurvivalSVM on the GBSG2 dataset using cross-validation with concordance index scoring.
特徴選択
Use CoxnetSurvivalAnalysis with elastic net regularization to perform feature selection on high-dimensional survival data, then identify which features were selected.
競合リスク
Demonstrate competing risks analysis using cumulative_incidence_competing_risks. Show how to estimate cumulative incidence for different event types and compare between treatment groups.

ベストプラクティス

  • SVMと正則化Coxモデルでは、適合前に特徴量を必ず標準化する
  • 打ち切りが40%を超える場合はHarrell'sではなくUno's C-index (concordance_index_ipcw)を使う
  • C-index、統合Brier score、時間依存AUCなど複数の評価指標を報告する

回避

  • 競合リスクがあるのにKaplan-Meier推定量を使用する(代わりに累積発生関数を使用)
  • Random Survival Forestの組み込み特徴量重要度を使用する(Permutation importanceを使用)
  • 解釈前にCoxモデルの比例ハザード仮定を確認しない

よくある質問

Harrell'sとUno's C-indexの違いは何ですか?
Harrell's C-indexは低い打ち切り率(<40%)で有効です。Uno'sはIPCW重み付けを使い、高い打ち切りでも不偏になります。
競合リスクはどのように扱えばよいですか?
推定にはcumulative_incidence_competing_risksを使うか、各イベントタイプごとに原因別Coxモデルを別々に適合します。
高次元データにはどのモデルを選ぶべきですか?
高次元設定の特徴選択には、elastic net正則化のCoxnetSurvivalAnalysisを使用します。
モデルのキャリブレーションはどう評価しますか?
discriminationとcalibrationの両方を評価するにはintegrated_brier_scoreを使用します。スコアが低いほど良好にキャリブレーションされています。
scikit-survivalをscikit-learnのパイプラインで使えますか?
はい。scikit-survivalのモデルはsklearn Pipeline、GridSearchCV、cross_val_scoreと互換性があります。
生存データにはどの前処理が必要ですか?
データをSurvオブジェクトに変換し、欠損値を処理し、カテゴリ変数をエンコードし、SVM向けに特徴量を標準化します。

開発者の詳細