스킬 deepchem

🧪

deepchem

Name: deepchem
Author: K-Dense-AI

안전 ⚡ 스크립트 포함📁 파일 시스템 액세스🌐 네트워크 접근

머신러닝을 화학 및 신약 개발에 적용

또한 다음에서 사용할 수 있습니다: davila7

DeepChem을 사용해 용해도, 독성, 결합 친화도와 같은 분자 특성을 예측하세요. 그래프 신경망을 학습하거나 ChemBERTa 같은 사전학습 모델을 활용해 신약 개발 및 재료과학 응용에 적용할 수 있습니다.

지원: Claude Codex Code(CC)

🥉 75 브론즈

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"deepchem" 사용 중입니다. Predict solubility for these molecules: 'CCO', 'CC(=O)O', 'c1ccccc1'

예상 결과:

용해도 예측값 (log mol/L):
• 에탄올 (CCO): -0.92
• 아세트산 (CC(=O)O): -0.45
• 벤젠 (c1ccccc1): -1.69
참고: 값이 낮을수록 수용성 용해도가 낮음을 의미합니다.

보안 감사

안전

v4 • 1/17/2026

This is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.

스캔된 파일

2,764

분석된 줄 수

발견 사항

총 감사 수

위험 요인

⚡ 스크립트 포함 (3)

scripts/graph_neural_network.py:1-339 scripts/predict_solubility.py:1-225 scripts/transfer_learning.py:1-376

📁 파일 시스템 액세스 (3)

scripts/graph_neural_network.py:55-65 scripts/predict_solubility.py:45-55 scripts/transfer_learning.py:50-60

🌐 네트워크 접근 (1)

SKILL.md:245-255

감사자: claude 감사 이력 보기 →

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

100

보안

사양 준수

만들 수 있는 것

화합물 라이브러리 스크리닝

대규모 화합물 라이브러리의 용해도와 독성을 예측하여 합성 후보의 우선순위를 정합니다.

분자 특성 모델 구축

그래프 신경망 또는 전통적 ML 알고리즘을 사용해 독점 데이터셋에서 맞춤 모델을 학습합니다.

전이학습 적용

ChemBERTa 같은 사전학습 화학 모델을 작은 데이터셋의 제한된 라벨 예제로 미세조정합니다.

이 프롬프트를 사용해 보세요

분자 데이터 로드

Use DeepChem to load a CSV file with SMILES strings at 'molecules.csv' and predict solubility using CircularFingerprint featurizer and a trained model.

GNN 모델 학습

Train a Graph Convolutional Network on the Tox21 dataset using DeepChem to predict toxicity across all 12 tasks.

전이학습

Use ChemBERTa pretrained model from HuggingFace and fine-tune it on my custom dataset at 'activity.csv' to predict binding affinity.

배치 예측

Load a trained DeepChem model and make predictions on a list of new SMILES strings: 'CCO', 'CC(=O)O', 'c1ccccc1'. Return confidence scores.

모범 사례

유사 분자로 인한 데이터 누수를 방지하려면 분자 데이터셋에서 random split 대신 ScaffoldSplitter를 사용
데이터셋 크기가 10,000 샘플 미만이면 사전학습 모델로 전이학습 적용
작은 데이터셋에서는 과적합을 막기 위해 드롭아웃(0.3-0.5)을 높이고 더 단순한 모델 사용

피하기

분자 데이터에 random train/test split 사용 - 유사 구조로 인한 데이터 누수 발생
1,000 샘플 미만 데이터셋에 깊은 GNN 학습 - 심각한 과적합 위험
독성 데이터셋의 클래스 불균형 무시 - 학습 전 항상 작업 분포 확인

자주 묻는 질문

어떤 featurizer를 사용해야 하나요?

GNN에는 MolGraphConvFeaturizer, 전통적 ML에는 CircularFingerprint, 해석 가능한 모델에는 RDKitDescriptors를 사용하세요.

작은 데이터셋은 어떻게 처리하나요?

ChemBERTa 또는 GROVER 사전학습 모델로 전이학습을 적용하세요. 데이터 증강과 더 강한 정규화를 사용하세요.

어떤 splitter를 사용해야 하나요?

분자 데이터셋에는 ScaffoldSplitter를 사용해 구조적으로 유사한 화합물이 동일한 분할에 머물도록 하세요.

내 데이터셋을 사용할 수 있나요?

네, 한 열에는 SMILES 문자열, 다른 열에는 타깃 값을 가진 CSV를 제공하세요. 사용자 지정 열 이름으로 CSVLoader를 사용하세요.

사용 가능한 사전학습 모델은 무엇인가요?

ChemBERTa, GROVER, MolFormer가 통합되어 있습니다. 도메인 특화 분자 표현을 위해 HuggingFace에서 로드하세요.

모델 성능을 어떻게 개선하나요?

다른 featurizer를 시도하고, 학습 에폭을 늘리며, AttentiveFP 같은 더 큰 모델을 사용하거나 사전학습 모델로 전이학습을 적용하세요.

개발자 세부 정보

작성자

K-Dense-AI

라이선스

MIT license

리포지토리

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/deepchem

참조

main

파일 구조

📁 references/

📄 api_reference.md

📄 workflows.md

📁 scripts/

📄 graph_neural_network.py

📄 predict_solubility.py

📄 transfer_learning.py

📄 evaluation.json

📄 SKILL.md