scikit-learn
ML 모델을 위한 scikit-learn 적용
También disponible en: K-Dense-AI
scikit-learn 가이드로 머신러닝 모델을 빠르게 구축합니다. 분류, 회귀, 클러스터링, 전처리, 파이프라인, 모델 평가와 즉시 사용 가능한 예제를 다룹니다.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "scikit-learn". 고객 이탈을 예측하는 분류 모델 구축
Resultado esperado:
- Model: RandomForestClassifier with 100 estimators
- Preprocessing: StandardScaler for numeric features, OneHotEncoder for categorical
- Cross-validation accuracy: 94.2% (+/- 1.3%)
- Top predictive features: contract_type, monthly_charges, tenure
- Recommendations: Consider GradientBoosting for higher accuracy, collect more features about customer complaints
Auditoría de seguridad
SeguroAll 566 static findings are FALSE POSITIVES. The static analyzer misidentified markdown documentation syntax (backticks for code formatting) as shell commands, Python import examples as dynamic imports, and 'PC2' (Principal Component 2) as C2 command-and-control keywords. This is a pure documentation/reference skill containing legitimate scikit-learn ML examples with no network calls, credential access, or file exfiltration capabilities.
Factores de riesgo
⚡ Contiene scripts (2)
⚙️ Comandos externos (2)
Puntuación de calidad
Lo que puedes crear
프로덕션 ML 파이프라인 구축
전처리, 모델 학습, 평가, 하이퍼파라미터 튜닝이 포함된 엔드투엔드 ML 워크플로 생성.
ML 알고리즘 비교
표준화된 지표와 교차 검증을 사용하여 다양한 분류기, 회귀기, 클러스터링 방법 평가.
비지도 학습 적용
클러스터링, 차원 축소, 이상치 탐지 기법을 사용하여 데이터에서 패턴 발견.
Prueba estos prompts
Build a classification model using scikit-learn. Use the breast cancer dataset. Train with train-test split, StandardScaler preprocessing, RandomForest classifier, and show classification report.
Perform clustering analysis on the iris dataset using scikit-learn. Compare K-Means, DBSCAN, and AgglomerativeClustering. Use elbow method and silhouette score to find optimal clusters. Visualize results with PCA.
Create a complete ML pipeline with ColumnTransformer for mixed numeric and categorical data. Include preprocessing (imputation, scaling, encoding), PCA for dimensionality reduction, and GradientBoosting classifier. Use GridSearchCV for hyperparameter tuning.
Evaluate a classification model using cross-validation. Show accuracy, precision, recall, F1-score, and ROC AUC. Create confusion matrix and learning curves. Compare with stratified k-fold for imbalanced classes.
Mejores prácticas
- 항상 파이프라인을 사용하여 교차 검증에서 데이터 누출 방지
- 정규화된 입력이 필요한 알고리즘(SVM, KNN, 신경망)에는 학습 전에 스케일링
- 분류 시 클래스 분포를 보존하기 위해 계층적 분할 사용
Evitar
- 분할 전 모든 데이터에 전처리 피팅(데이터 누출 발생)
- 불균형 분류 문제에 정확도만 사용
- 재현성을 위해 random_state 설정 안 함