Навыки deepchem
🧪

deepchem

Безопасно ⚡ Содержит скрипты📁 Доступ к файловой системе🌐 Доступ к сети

Применяйте машинное обучение в химии и разработке лекарств

Также доступно от: davila7

Предсказывайте молекулярные свойства, такие как растворимость, токсичность и аффинность связывания, с помощью DeepChem. Обучайте графовые нейронные сети или используйте предварительно обученные модели вроде ChemBERTa для задач разработки лекарств и материаловедения.

Поддерживает: Claude Codex Code(CC)
🥉 76 Бронза
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «deepchem». Predict solubility for these molecules: 'CCO', 'CC(=O)O', 'c1ccccc1'

Ожидаемый результат:

  • Predictions of solubility (log mol/L):
  • • Ethanol (CCO): -0.92
  • • Acetic acid (CC(=O)O): -0.45
  • • Benzene (c1ccccc1): -1.69
  • Note: Lower values indicate lower aqueous solubility.

Аудит безопасности

Безопасно
v4 • 1/17/2026

This is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.

8
Просканировано файлов
2,764
Проанализировано строк
3
находки
4
Всего аудитов

Оценка качества

64
Архитектура
100
Сопровождаемость
83
Контент
30
Сообщество
100
Безопасность
87
Соответствие спецификации

Что вы можете построить

Скрининг библиотек соединений

Предсказывайте растворимость и токсичность для больших библиотек соединений, чтобы приоритизировать кандидатов для синтеза.

Построение моделей молекулярных свойств

Обучайте пользовательские модели на проприетарных наборах данных с использованием графовых нейронных сетей или традиционных ML-алгоритмов.

Применение переноса обучения

Дообучайте предварительно обученные химические модели вроде ChemBERTa на небольших наборах данных с ограниченным числом размеченных примеров.

Попробуйте эти промпты

Загрузка молекулярных данных
Use DeepChem to load a CSV file with SMILES strings at 'molecules.csv' and predict solubility using CircularFingerprint featurizer and a trained model.
Обучение модели GNN
Train a Graph Convolutional Network on the Tox21 dataset using DeepChem to predict toxicity across all 12 tasks.
Перенос обучения
Use ChemBERTa pretrained model from HuggingFace and fine-tune it on my custom dataset at 'activity.csv' to predict binding affinity.
Пакетные предсказания
Load a trained DeepChem model and make predictions on a list of new SMILES strings: 'CCO', 'CC(=O)O', 'c1ccccc1'. Return confidence scores.

Лучшие практики

  • Используйте ScaffoldSplitter вместо случайного разбиения для молекулярных наборов данных, чтобы предотвратить утечку данных из-за похожих молекул
  • Применяйте перенос обучения с предварительно обученными моделями, когда размер набора данных меньше 10 000 образцов
  • Увеличивайте dropout (0.3-0.5) и используйте более простые модели для небольших наборов данных, чтобы предотвратить переобучение

Избегать

  • Использование случайных train/test разбиений для молекулярных данных — приводит к утечке данных из-за похожих структур
  • Обучение глубоких GNN на наборах данных меньше 1 000 образцов — высокий риск сильного переобучения
  • Игнорирование дисбаланса классов в наборах токсичности — всегда проверяйте распределение задач перед обучением

Часто задаваемые вопросы

Какой фичеризатор мне использовать?
Используйте MolGraphConvFeaturizer для GNN, CircularFingerprint для традиционного ML и RDKitDescriptors для интерпретируемых моделей.
Как работать с небольшими наборами данных?
Применяйте перенос обучения с предварительно обученными моделями ChemBERTa или GROVER. Используйте аугментацию данных и более сильную регуляризацию.
Какой сплиттер мне использовать?
Используйте ScaffoldSplitter для молекулярных наборов данных, чтобы структурно похожие соединения оставались в одном разбиении.
Могу ли я использовать свой набор данных?
Да, предоставьте CSV со строками SMILES в одной колонке и целевыми значениями в другой. Используйте CSVLoader с пользовательскими именами колонок.
Какие предварительно обученные модели доступны?
ChemBERTa, GROVER и MolFormer интегрированы. Загружайте из HuggingFace для предметно-ориентированных молекулярных представлений.
Как улучшить производительность модели?
Пробуйте разные фичеризаторы, увеличивайте число эпох обучения, используйте более крупные модели вроде AttentiveFP или применяйте перенос обучения с предварительно обученных моделей.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

MIT license

Ссылка

main