deepchem
머신러닝을 화학 및 신약 개발에 적용
Auch verfügbar von: davila7
DeepChem을 사용해 용해도, 독성, 결합 친화도와 같은 분자 특성을 예측하세요. 그래프 신경망을 학습하거나 ChemBERTa 같은 사전학습 모델을 활용해 신약 개발 및 재료과학 응용에 적용할 수 있습니다.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "deepchem". Predict solubility for these molecules: 'CCO', 'CC(=O)O', 'c1ccccc1'
Erwartetes Ergebnis:
- 용해도 예측값 (log mol/L):
- • 에탄올 (CCO): -0.92
- • 아세트산 (CC(=O)O): -0.45
- • 벤젠 (c1ccccc1): -1.69
- 참고: 값이 낮을수록 수용성 용해도가 낮음을 의미합니다.
Sicherheitsaudit
SicherThis is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.
Risikofaktoren
⚡ Enthält Skripte (3)
📁 Dateisystemzugriff (3)
🌐 Netzwerkzugriff (1)
Qualitätsbewertung
Was du bauen kannst
화합물 라이브러리 스크리닝
대규모 화합물 라이브러리의 용해도와 독성을 예측하여 합성 후보의 우선순위를 정합니다.
분자 특성 모델 구축
그래프 신경망 또는 전통적 ML 알고리즘을 사용해 독점 데이터셋에서 맞춤 모델을 학습합니다.
전이학습 적용
ChemBERTa 같은 사전학습 화학 모델을 작은 데이터셋의 제한된 라벨 예제로 미세조정합니다.
Probiere diese Prompts
Use DeepChem to load a CSV file with SMILES strings at 'molecules.csv' and predict solubility using CircularFingerprint featurizer and a trained model.
Train a Graph Convolutional Network on the Tox21 dataset using DeepChem to predict toxicity across all 12 tasks.
Use ChemBERTa pretrained model from HuggingFace and fine-tune it on my custom dataset at 'activity.csv' to predict binding affinity.
Load a trained DeepChem model and make predictions on a list of new SMILES strings: 'CCO', 'CC(=O)O', 'c1ccccc1'. Return confidence scores.
Bewährte Verfahren
- 유사 분자로 인한 데이터 누수를 방지하려면 분자 데이터셋에서 random split 대신 ScaffoldSplitter를 사용
- 데이터셋 크기가 10,000 샘플 미만이면 사전학습 모델로 전이학습 적용
- 작은 데이터셋에서는 과적합을 막기 위해 드롭아웃(0.3-0.5)을 높이고 더 단순한 모델 사용
Vermeiden
- 분자 데이터에 random train/test split 사용 - 유사 구조로 인한 데이터 누수 발생
- 1,000 샘플 미만 데이터셋에 깊은 GNN 학습 - 심각한 과적합 위험
- 독성 데이터셋의 클래스 불균형 무시 - 학습 전 항상 작업 분포 확인
Häufig gestellte Fragen
어떤 featurizer를 사용해야 하나요?
작은 데이터셋은 어떻게 처리하나요?
어떤 splitter를 사용해야 하나요?
내 데이터셋을 사용할 수 있나요?
사용 가능한 사전학습 모델은 무엇인가요?
모델 성능을 어떻게 개선하나요?
Entwicklerdetails
Autor
K-Dense-AILizenz
MIT license
Repository
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/deepchemRef
main
Dateistruktur