data-scientist
数据科学家专家
需要关于数据分析、机器学习模型和统计建模的专业指导。此技能提供一个专业的数据科学家角色,可主动帮助处理复杂的分析、预测建模和商业智能任务。
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "data-scientist". 分析客户流失并构建预测模型
Résultat attendu:
## 流失分析方法
### 1. 探索性数据分析
- 关键特征的分布(使用时长、使用量、账单)
- 预测因子与流失之间的相关性分析
- 各细分市场的流失率
### 2. 推荐的模型
- 算法:XGBoost(带类别平衡)
- 特征:客户生命周期中提取的15-20个工程特征
- 验证:5折交叉验证,使用AUC-ROC
### 3. 关键预测因子(SHAP分析)
- 合同类型(最强预测因子)
- 月费用
- 使用时长
- 支付方式
### 4. 可操作的见解
- 瞄准月付合同客户
- 在12个月使用时长时提供激励
- 密切关注高费用客户
Utilisation de "data-scientist". 为网站结账流程设计A/B测试
Résultat attendu:
## A/B测试设计
### 假设
新结账流程将使转化率提高5%
### 样本量计算
- 基线转化率:3%
- 最小可检测效应:5%
- 统计功效:80%
- 显著性水平:5%
- 所需样本:每组约25,000
### 随机化
- 随机化单位:user_id
- 按流量来源分层
- 确保均匀分配
### 指标
- 主要指标:转化率
- 次要指标:每用户收入、购物车放弃率
- 监控指标:页面加载时间
### 分析计划
- 双比例z检验
- 置信区间
- 序贯监测边界
Audit de sécurité
SûrPrompt-only skill containing only expertise instructions for AI behavior. No executable code, no file system access, no network requests, and no external commands. The SKILL.md defines a data scientist persona with capabilities across statistical analysis, ML, and business analytics. Static analysis scanned 0 files with 0 issues detected. This is a safe, read-only prompt skill.
Score de qualité
Ce que vous pouvez construire
构建预测性客户流失模型
分析客户数据以识别流失模式,并构建预测模型来识别有流失风险的客户,提供可操作的留存建议。
设计和分析A/B测试
设计随机对照实验,通过功效分析确定样本量,并使用统计显著性检验正确分析结果。
创建需求预测系统
使用ARIMA、Prophet或深度学习方法构建时间序列预测模型,以支持库存计划和供应链优化。
Essayez ces prompts
帮我分析这个数据集。关键的模式、分布和相关性是什么?提供统计摘要和初步见解。
我需要为[具体结果]构建预测模型。数据包括[描述特征]。推荐适当的算法,帮助进行特征工程,并指导我完成模型选择和验证。
为[功能/处理]设计A/B测试。我应该如何确定样本量?分析应该使用什么统计方法?如何处理多重比较?
为[具体分析]创建可视化。受众是[技术/非技术]。哪些图表类型最有效?帮助我讲述一个引人注目的数据故事。
Bonnes pratiques
- 在应用统计方法之前始终验证假设 - 检查正态性、独立性和同方差性
- 使用置信区间和p值清晰传达不确定性,而不仅仅是统计显著性
- 从简单的基线模型开始,然后再转向复杂方法 - 记录为什么需要更复杂的方法
Éviter
- 当简单的统计方法足够时使用复杂的ML模型 - 过度设计解决方案会增加不必要的复杂性
- 忽略数据质量问题,在没有适当EDA的情况下直接进行建模
- 报告结果时不考虑实际意义 - 统计显著性并不总是等同于商业价值