scikit-survival
تحليل بيانات البقاء مع scikit-survival
متاح أيضًا من: davila7
يتعامل تحليل البقاء مع البيانات التي قد لا تكون فيها الأحداث قد حدثت لجميع الموضوعات. توفر هذه الأداة أدوات Python للنمذجة الزمنية للحدث مع البيانات المُرقَّبة باستخدام نماذج Cox، والغابات العشوائية للبقاء، وآلات المتجهات الداعمة، ومقاييس التقييم المتخصصة مثل مؤشر التوافق.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "scikit-survival". Build a survival model for the veterans lung cancer dataset and evaluate performance
النتيجة المتوقعة:
- Loaded veterans_lung_cancer dataset with 137 patients
- Censoring rate: 8.0% (11 events, 126 censored)
- Fitted CoxPHSurvivalAnalysis with concordance_index_ipcw = 0.73
- Top risk factors: Karnofsky score (HR=0.96), age (HR=1.02)
- Time-dependent AUC at 180 days: 0.81
استخدام "scikit-survival". Compare Random Survival Forest and Cox model on GBSG2 breast cancer data
النتيجة المتوقعة:
- Loaded GBSG2 dataset with 2238 patients, 1548 events
- RandomSurvivalForest C-index: 0.68 (5-fold CV)
- CoxPHSurvivalAnalysis C-index: 0.66 (5-fold CV)
- RSF selected 12/7 features via permutation importance
- Recommendation: RSF provides slightly better ranking ability
التدقيق الأمني
آمنAll 277 static findings are FALSE POSITIVES. This skill contains only markdown documentation for the legitimate scikit-survival Python library. The 'Ruby/shell backtick execution' detections are markdown code fences (```python) for Python syntax highlighting. No executable code, scripts, or malicious patterns exist. The 'C2 keywords' and 'weak cryptographic algorithm' detections are false positives caused by statistical/medical terminology being misidentified by the pattern scanner.
عوامل الخطر
⚡ يحتوي على سكربتات (2)
⚙️ الأوامر الخارجية (3)
🌐 الوصول إلى الشبكة (1)
درجة الجودة
ماذا يمكنك بناءه
تنبؤ البقاء للمرضى
تحليل بيانات التجارب السريرية للتنبؤ باحتمالات بقاء المرضى وتحديد عوامل الخطر للنتائج السلبية.
التعلم الآلي للحدث الزمني
بناء ومقارنة نماذج البقاء المتعددة بما في ذلك Cox، والغابة العشوائية للبقاء، وآلة المتجهات الداعمة للصيانة التنبؤية أو تسرب العملاء.
نمذجة تطور المرض
دراسة بيانات الحدث الزمني مع المخاطر المتنافسة مثل الوفاة لأسباب مختلفة في دراسات تطور المرض.
جرّب هذه الموجهات
استخدم scikit-survival لتحميل مجموعة بيانات سرطان الثدي، وقسمتها إلى مجموعات تدريب واختبار، وملاءمة نموذج المخاطر النسبية Cox، والتقييم باستخدام مؤشر التوافق لـ Uno.
قارن بين CoxPHSurvivalAnalysis و RandomSurvivalForest و GradientBoostingSurvivalAnalysis و FastSurvivalSVM على مجموعة بيانات GBSG2 باستخدام التحقق المتقاطع مع تقييم مؤشر التوافق.
استخدم CoxnetSurvivalAnalysis مع التنظيم الشبكي المرن لإجراء اختيار السمات على بيانات البقاء عالية الأبعاد، ثم حدد أي السمات تم اختيارها.
وضح تحليل المخاطر المتنافسة باستخدام cumulative_incidence_competing_risks. أظهر كيفية تقدير الحادث التراكمي لأنواع الأحداث المختلفة والمقارنة بين مجموعات العلاج.
أفضل الممارسات
- قم دائمًا بتوحيد السمات لآلات المتجهات الداعمة ونماذج Cox المُعاقَبة قبل الملاءمة
- استخدم مؤشر التوافق لـ Uno (concordance_index_ipcw) بدلاً من Harrell's عندما تتجاوز الرقابة 40%
- بلغ عن مقاييس تقييم متعددة بما في ذلك مؤشر التوافق، ودرجة بrier المتكاملة، والمساحة تحت المنحنى الزمنية
تجنب
- استخدام مقدر كابلان-ماير عند وجود المخاطر المتنافسة (استخدم الحادث التراكمي بدلاً من ذلك)
- استخدام أهمية السمات المدمجة للغابات العشوائية للبقاء (استخدم أهمية التباديل)
- عدم التحقق من افتراض المخاطر النسبية لنماذج Cox قبل التفسير
الأسئلة المتكررة
ما الفرق بين مؤشر التوافق لـ Harrell و Uno؟
كيف أتعامل مع المخاطر المتنافسة؟
أي نموذج يجب أن أختاره للبيانات عالية الأبعاد؟
كيف أقوم بتقييم معايرة النموذج؟
هل يمكنني استخدام scikit-survival مع خطوط scikit-learn؟
ما المعالجة المطلوبة لبيانات البقاء؟
تفاصيل المطور
المؤلف
K-Dense-AIالترخيص
GPL-3.0 license
المستودع
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/scikit-survivalمرجع
main
بنية الملفات