deepchem
機械学習を化学と創薬に適用する
Auch verfügbar von: davila7
DeepChemを使用して、溶解性、毒性、結合親和性などの分子特性を予測します。グラフニューラルネットワークを訓練するか、ChemBERTaなどの事前学習済みモデルを使用して、創薬や材料科学のアプリケーションに活用します。
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "deepchem". これらの分子の溶解性を予測してください: 'CCO', 'CC(=O)O', 'c1ccccc1'
Erwartetes Ergebnis:
- 溶解性予測(log mol/L):
- • エタノール(CCO): -0.92
- • 酢酸(CC(=O)O): -0.45
- • ベンゼン(c1ccccc1): -1.69
- 注意: 値が低いほど水に対する溶解性が低いことを示します。
Sicherheitsaudit
SicherThis is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.
Risikofaktoren
⚡ Enthält Skripte (3)
📁 Dateisystemzugriff (3)
🌐 Netzwerkzugriff (1)
Qualitätsbewertung
Was du bauen kannst
化合物ライブラリーのスクリーニング
大規模な化合物ライブラリーの溶解性と毒性を予測し、合成候補を優先順位付けします。
分子特性モデルの構築
グラフニューラルネットワークまたは従来のMLアルゴリズムを使用して、独自データセットでカスタムモデルを訓練します。
転移学習の適用
ChemBERTaなどの事前学習済み化学モデルを、ラベル付き例が限定された小規模データセットでファインチューニングします。
Probiere diese Prompts
DeepChemを使用して、'molecules.csv'にあるSMILES文字列を含むCSVファイルをロードし、CircularFingerprint特徴量化器と訓練済みモデルを使用して溶解性を予測します。
DeepChemを使用してTox21データセットでグラフ畳み込みネットワークを訓練し、12すべてのタスクで毒性を予測します。
HuggingFaceからChemBERTa事前学習済みモデルを使用し、'activity.csv'にある独自データセットでファインチューニングして結合親和性を予測します。
訓練済みのDeepChemモデルをロードし、新しいSMILES文字列のリスト「'CCO', 'CC(=O)O', 'c1ccccc1'」で予測を行います。信頼スコアを返します。
Bewährte Verfahren
- 類似した分子からのデータ漏洩を防ぐため、分子データセットではランダム分割ではなくScaffoldSplitterを使用する
- データセットサイズが10,000サンプル未満の場合は、事前学習済みモデルで転移学習を適用する
- 過学習を防ぐため、小規模データセットではドロップアウトを高め(0.3-0.5)、よりシンプルなモデルを使用する
Vermeiden
- 分子データでランダムなトレイン/テスト分割を使用する - 類似した構造からのデータ漏洩につながる
- 1,000サンプル未満のデータセットで深いGNNを訓練する - 深刻な過学習のリスク
- 毒性データセットのクラス不均衡を無視する - 訓練前にタスク分布を必ず確認する
Häufig gestellte Fragen
どの特徴量化器を使用すべきですか?
小規模なデータセットはどう対処すればよいですか?
どの分割器を使用すべきですか?
自分のデータセットを使用できますか?
どのような事前学習済みモデルが利用可能ですか?
モデルのパフォーマンスを改善するにはどうすればよいですか?
Entwicklerdetails
Autor
K-Dense-AILizenz
MIT license
Repository
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/deepchemRef
main
Dateistruktur