기계 학습 모델은 종종 블랙박스로 작동합니다. SHAP는 예측을 이끌어내는 특성과 각 특성이 얼마나 기여하는지를 이해하기 위한 통합 프레임워크를 제공합니다. 이 스킬은 특성 중요도 계산, 시각화 생성, 모델 디버깅, 프로젝트에서 설명 가능한 AI 구현을 도와줍니다.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "shap". 내 XGBoost 대출 승인 모델에 대해 가장 중요한 상위 5개 특성을 설명하고 특정 신청서가 거부된 이유를 보여주세요.
Resultado esperado:
- 평균 |SHAP|별 상위 5개 특성: 신용점수, 소득, 대출액, 고용기간, 부채 대비 소득 비율
- 이 거부된 신청서의 경우:
- - 신용점수(580)가 승인 확률을 0.25 감소 (중앙값 미만)
- - 소득($35,000)이 확률을 0.18 감소
- - 높은 부채 대비 소득(0.45)이 추가로 0.12 감소
- - 대출액($25,000)이 0.05의 약간 부정적 영향
- - 고용기간(2년)이 미미하게 긍정적 (+0.03)
Auditoría de seguridad
SeguroPure documentation skill with no code execution, network calls, file access, or external dependencies. All 297 static findings are false positives: markdown backticks (code formatting), SHA in SHAP (Shapley values, not cryptography), and documentation file references.
Factores de riesgo
⚙️ Comandos externos (262)
🌐 Acceso a red (3)
Puntuación de calidad
Lo que puedes crear
모델 예측 디버깅
개별 샘플에 대한 특성 기여도를 시각화하여 모델이 특정 예측을 하는 이유 파악
설명 가능한 AI 배포
캐시된 설명자와 효율적인 배치 처리를 포함하여 프로덕션 API에 SHAP 설명 통합
모델 공정성 분석
공정한 예측을 보장하기 위해 인구통계학적 그룹 간 특성 중요도를 비교하여 편향 감지
Prueba estos prompts
[XGBoost/LightGBM/Random Forest] 모델에 대한 SHAP 값과 비스웜 플롯을 생성하여 [데이터셋 설명]에 대해 가장 중요한 특성이 무엇인지 보여주세요.
모델이 특정 샘플에 대해 [특정 결과]를 예측한 이유를 설명해 주세요. 샘플 인덱스 [숫자]에 대한 특성 기여도가 포함된 워터플로 플롯을 보여주세요.
[모델 A]와 [모델 B] 간의 특성 중요도를 비교해 주세요. 각 모델이 가장 많이 의존하는 특성과 설명이 어떻게 다른지를 보여주는 막대 플롯을 생성하세요.
[성별/나이/인종과 같은 보호된 특성]에 걸쳐 내 모델의 잠재적 편향을 분석해 주세요. [그룹 A]와 [그룹 B]에 대한 SHAP 값을 비교하여 특정 그룹이 다르게 처리되는지 확인해 주세요.
Mejores prácticas
- 트리 기반 모델(XGBoost, LightGBM, Random Forest)에 TreeExplainer 사용 - 정확하고 KernelExplainer보다 훨씬 빠름
- 전체 패턴 이해를 위해 비스웜과 같은 전역 시각화로 시작하고, 워터플로 플롯으로 개별 예측으로 드릴다운
- SHAP 설명을 도메인 지식에 대해 검증 - SHAP는 모델 동작을 보여줄 뿐 인과관계가 아님
Evitar
- TreeExplainer를 사용할 수 있을 때 트리 기반 모델에 KernelExplainer 사용 (불필요하게 느림)
- 분류기 모델에서 모델 출력 유형을 확인하지 않고 log-odds를 확률로 해석
- 높은 특성 중요도가 인과관계가 아닌 모델이 학습한 연관성이라고 가정
Preguntas frecuentes
내 모델에 어떤 SHAP 설명자를 사용해야 하나요?
KernelExplainer에 필요한 배경 샘플 수는 얼마나 되나요?
PyTorch 또는 TensorFlow 모델에서 SHAP를 사용할 수 있나요?
SHAP를 사용할 때 내 데이터가 안전한가요?
내 XGBoost SHAP 값이 확률이 아닌 log-odds인 이유는 무엇인가요?
SHAP는 LIME이나 순열 중요도와 비교하여 어떻게 되나요?
Detalles del desarrollador
Autor
davila7Licencia
MIT
Repositorio
https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/shapRef.
main
Estructura de archivos