DeepChem을 사용해 용해도, 독성, 결합 친화도와 같은 분자 특성을 예측하세요. 그래프 신경망을 학습하거나 ChemBERTa 같은 사전학습 모델을 활용해 신약 개발 및 재료과학 응용에 적용할 수 있습니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"deepchem" 사용 중입니다. Predict solubility for these molecules: 'CCO', 'CC(=O)O', 'c1ccccc1'
예상 결과:
- 용해도 예측값 (log mol/L):
- • 에탄올 (CCO): -0.92
- • 아세트산 (CC(=O)O): -0.45
- • 벤젠 (c1ccccc1): -1.69
- 참고: 값이 낮을수록 수용성 용해도가 낮음을 의미합니다.
보안 감사
안전This is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.
위험 요인
품질 점수
만들 수 있는 것
화합물 라이브러리 스크리닝
대규모 화합물 라이브러리의 용해도와 독성을 예측하여 합성 후보의 우선순위를 정합니다.
분자 특성 모델 구축
그래프 신경망 또는 전통적 ML 알고리즘을 사용해 독점 데이터셋에서 맞춤 모델을 학습합니다.
전이학습 적용
ChemBERTa 같은 사전학습 화학 모델을 작은 데이터셋의 제한된 라벨 예제로 미세조정합니다.
이 프롬프트를 사용해 보세요
Use DeepChem to load a CSV file with SMILES strings at 'molecules.csv' and predict solubility using CircularFingerprint featurizer and a trained model.
Train a Graph Convolutional Network on the Tox21 dataset using DeepChem to predict toxicity across all 12 tasks.
Use ChemBERTa pretrained model from HuggingFace and fine-tune it on my custom dataset at 'activity.csv' to predict binding affinity.
Load a trained DeepChem model and make predictions on a list of new SMILES strings: 'CCO', 'CC(=O)O', 'c1ccccc1'. Return confidence scores.
모범 사례
- 유사 분자로 인한 데이터 누수를 방지하려면 분자 데이터셋에서 random split 대신 ScaffoldSplitter를 사용
- 데이터셋 크기가 10,000 샘플 미만이면 사전학습 모델로 전이학습 적용
- 작은 데이터셋에서는 과적합을 막기 위해 드롭아웃(0.3-0.5)을 높이고 더 단순한 모델 사용
피하기
- 분자 데이터에 random train/test split 사용 - 유사 구조로 인한 데이터 누수 발생
- 1,000 샘플 미만 데이터셋에 깊은 GNN 학습 - 심각한 과적합 위험
- 독성 데이터셋의 클래스 불균형 무시 - 학습 전 항상 작업 분포 확인