data-scientist
데이터 사이언티스트 전문가
데이터 분석, 머신러닝 모델, 통계 모델링에 대한 전문적인 지침이 필요합니다. 이 스킬은 복잡한 분석, 예측 모델링, 비즈니스 인텔리전스 작업을 적극적으로 지원하는 전문 데이터 사이언티스트 페르소나를 제공합니다.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "data-scientist". 고객 이탈을 분석하고 예측 모델을 구축하세요
Résultat attendu:
## 이탈 분석 접근법
### 1. 탐색적 데이터 분석
- 주요 특징의 분포 (재직기간, 사용량, 청구)
- 예측변수와 이탈 간의 상관관계 분석
- 세그먼트별 이탈률
### 2. 권장 모델
- 알고리즘: 클래스 밸런싱이 적용된 XGBoost
- 특징: 고객 라이프사이클에서 엔지니어링된 15-20 개 특징
- 검증: AUC-ROC 를 사용한 5-폴드 교차 검증
### 3. 주요 예측변수 (SHAP 분석)
- 계약 유형 (가장 강력한 예측변수)
- 월간 요금
- 재직기간 길이
- 결제 방법
### 4. 실행 가능한 인사이트
- 월별 계약 고객 타겟팅
- 12 개월 재직 시점에 인센티브 제공
- 고요금 고객 면밀히 모니터링
Utilisation de "data-scientist". 웹사이트 체크아웃 플로우에 대한 A/B 테스트 설계
Résultat attendu:
## A/B 테스트 설계
### 가설
새 체크아웃 플로우가 전환율을 5% 향상시킬 것이다
### 표본 크기 계산
- 기본 전환율: 3%
- 최소 감지 효과: 5%
- 통계적 검정력: 80%
- 유의수준: 5%
- 필요한 표본: 변형당 약 25,000 명
### 무작위화
- 무작위화 단위: user_id
- 트래픽 소스별 층화
- 균등 할당 보장
### 지표
- 주요: 전환율
- 보조: 사용자당 수익, 장바구니 포기율
- 가드레일: 페이지 로드 시간
### 분석 계획
- 두 비율 z-검정
- 신뢰구간
- 순차 모니터링 경계
Audit de sécurité
SûrPrompt-only skill containing only expertise instructions for AI behavior. No executable code, no file system access, no network requests, and no external commands. The SKILL.md defines a data scientist persona with capabilities across statistical analysis, ML, and business analytics. Static analysis scanned 0 files with 0 issues detected. This is a safe, read-only prompt skill.
Score de qualité
Ce que vous pouvez construire
예측 고객 이탈 모델 구축
고객 데이터를 분석하여 이탈 패턴을 식별하고, 위험에 처한 고객을 식별하며 실행 가능한 유지 권장사항을 제공하는 예측 모델을 구축합니다.
A/B 테스트 설계 및 분석
무작위 통제 실험을 설계하고, 검정력 분석을 통해 표본 크기를 결정하며, 통계적 유의성 검정으로 결과를 적절히 분석합니다.
수요 예측 시스템 구축
재고 계획 및 공급망 최적화를 위해 ARIMA, Prophet 또는 딥러닝 접근 방식을 사용하여 시계열 예측 모델을 구축합니다.
Essayez ces prompts
이 데이터셋을 분석하는 것을 도와주세요. 주요 패턴, 분포, 상관관계는 무엇입니까? 통계적 요약과 초기 인사이트를 제공하세요.
[특정 결과] 에 대한 예측 모델을 구축해야 합니다. 데이터에는 [특징 설명] 이 포함됩니다. 적절한 알고리즘을 추천하고, 특징 엔지니어링을 도와주며, 모델 선택 및 검증을 안내해주세요.
[기능/처리] 에 대한 A/B 테스트를 설계해주세요. 표본 크기는 어떻게 결정해야 합니까? 분석에 어떤 통계적 방법을 사용해야 합니까? 다중 비교는 어떻게 고려해야 합니까?
[특정 분석] 에 대한 시각화를 생성하세요. 청중은 [기술/비기술] 입니다. 어떤 차트 유형이 가장 효과적입니까? 설득력 있는 데이터 스토리를 전달하는 것을 도와주세요.
Bonnes pratiques
- 통계적 방법을 적용하기 전에 항상 가정을 검증하세요 - 정규성, 독립성, 등분산성을 확인하세요
- 단순한 통계적 유의성 대신 신뢰구간과 p-값을 사용하여 불확실성을 명확히 전달하세요
- 복잡한 접근 방식으로 이동하기 전에 기본 모델로 간단하게 시작하세요 - 더 정교한 방법이 필요한 이유를 문서화하세요
Éviter
- 간단한 통계 방법으로 충분한 경우 복잡한 ML 모델 사용 - 과도한 엔지니어링은 불필요한 복잡성을 추가합니다
- 적절한 EDA 없이 데이터 품질 문제를 무시하고 바로 모델링으로 진행
- 실질적 유의성을 고려하지 않고 결과 보고 - 통계적 유의성이 항상 비즈니스 가치를 의미하는 것은 아닙니다