data-scientist
データサイエンティストエキスパート
データ分析、機械学習モデル、統計モデリングに関する専門的なガイダンスが必要な方へ。このスキルは、複雑な分析、予測モデリング、ビジネスインテリジェンスタスクを積極的に支援するプロフェッショナルなデータサイエンティストのペルソナを提供します。
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "data-scientist". 顧客離反を分析し、予測モデルを構築する
Résultat attendu:
## 離反分析アプローチ
### 1. 探索的データ分析
- 主な特徴の分布(利用期間、使用量、請求)
- 予測変数と離反の相関分析
- セグメント別離反率
### 2. 推奨モデル
- アルゴリズム:クラスバランス付き XGBoost
- 特徴:顧客ライフサイクルから作成した 15-20 のエンジニアリング特徴
- 検証:AUC-ROC を用いた 5 fold 交差検証
### 3. 主な予測因子(SHAP 分析)
- 契約タイプ(最強の予測因子)
- 月額料金
- 利用期間の長さ
- 支払い方法
### 4. 実行可能な洞察
- 月極め契約の顧客をターゲットにする
- 12 ヶ月利用時点でインセンティブを提供
- 高料金の顧客を注意深くモニタリング
Utilisation de "data-scientist". ウェブサイトチェックアウトフローの A/B テストを設計
Résultat attendu:
## A/B テスト設計
### 仮説
新しいチェックアウトフローはコンバージョン率を 5% 向上させる
### サンプルサイズ計算
- ベースラインコンバージョン:3%
- 最小検出可能効果:5%
- 統計的検出力:80%
- 有意水準:5%
- 必要サンプル数:バリアントあたり約 25,000
### ランダム化
- ランダム化の単位:user_id
- トラフィックソースによる層別化
- 均等配分を確保
### メトリクス
- 主要:コンバージョン率
- 二次:ユーザーあたりの収益、カート放棄率
- ガードレール:ページ読み込み時間
### 分析計画
- 2 比例の z 検定
- 信頼区間
- 逐次モニタリング境界
Audit de sécurité
SûrPrompt-only skill containing only expertise instructions for AI behavior. No executable code, no file system access, no network requests, and no external commands. The SKILL.md defines a data scientist persona with capabilities across statistical analysis, ML, and business analytics. Static analysis scanned 0 files with 0 issues detected. This is a safe, read-only prompt skill.
Score de qualité
Ce que vous pouvez construire
予測的顧客離反モデルの構築
顧客データを分析して離反パターンを特定し、リスクのある顧客を特定するための予測モデルを構築し、実行可能なリテンション推奨事項を提供します。
A/B テストの設計と分析
ランダム化比較実験を設計し、検出力分析を通じてサンプルサイズを決定し、統計的有意性検定を用いて結果を適切に分析します。
需要予測システムの作成
在庫計画とサプライチェーン最適化のため、ARIMA、Prophet、または深層学習アプローチを使用して時系列予測モデルを構築します。
Essayez ces prompts
このデータセットの分析を支援してください。主なパターン、分布、相関関係は何ですか?統計的要約と初期の洞察を提供してください。
[特定の outcome] の予測モデルを構築する必要があります。データには [特徴の説明] が含まれています。適切なアルゴリズムを推奨し、特徴エンジニアリングを支援し、モデル選択と検証を通じてガイダンスを提供してください。
[機能/治療] の A/B テストを設計してください。サンプルサイズはどのように決定すべきですか?分析にはどのような統計的手法を使用すべきですか?多重比較はどのように考慮すればよいですか?
[特定の分析] の可視化を作成してください。対象読者は [技術者/非技術者] です。どのようなチャートタイプが最も効果的ですか?説得力のあるデータストーリーを語るのを支援してください。
Bonnes pratiques
- 統計的手法を適用する前に常に仮定を検証する - 正規性、独立性、等分散性を確認する
- 統計的有意性だけでなく、信頼区間と p 値を使用して不確実性を明確に伝える
- 複雑なアプローチに移行する前にベースラインモデルから簡単に始める - より高度な手法が必要である理由を文書化する
Éviter
- 単純な統計的手法で十分な場合に複雑な機械学習モデルを使用する - ソリューションの過度なエンジニアリングは不必要な複雑さを加える
- データ品質の問題を無視し、適切な EDA なしにモデリングに直接進める
- 実質的有意性を考慮せずに結果を報告する - 統計的有意性は常にビジネス価値を意味するわけではない