deepchem
Применяйте машинное обучение в химии и разработке лекарств
Также доступно от: davila7
Предсказывайте молекулярные свойства, такие как растворимость, токсичность и аффинность связывания, с помощью DeepChem. Обучайте графовые нейронные сети или используйте предварительно обученные модели вроде ChemBERTa для задач разработки лекарств и материаловедения.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «deepchem». Predict solubility for these molecules: 'CCO', 'CC(=O)O', 'c1ccccc1'
Ожидаемый результат:
- Predictions of solubility (log mol/L):
- • Ethanol (CCO): -0.92
- • Acetic acid (CC(=O)O): -0.45
- • Benzene (c1ccccc1): -1.69
- Note: Lower values indicate lower aqueous solubility.
Аудит безопасности
БезопасноThis is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.
Факторы риска
⚡ Содержит скрипты (3)
📁 Доступ к файловой системе (3)
🌐 Доступ к сети (1)
Оценка качества
Что вы можете построить
Скрининг библиотек соединений
Предсказывайте растворимость и токсичность для больших библиотек соединений, чтобы приоритизировать кандидатов для синтеза.
Построение моделей молекулярных свойств
Обучайте пользовательские модели на проприетарных наборах данных с использованием графовых нейронных сетей или традиционных ML-алгоритмов.
Применение переноса обучения
Дообучайте предварительно обученные химические модели вроде ChemBERTa на небольших наборах данных с ограниченным числом размеченных примеров.
Попробуйте эти промпты
Use DeepChem to load a CSV file with SMILES strings at 'molecules.csv' and predict solubility using CircularFingerprint featurizer and a trained model.
Train a Graph Convolutional Network on the Tox21 dataset using DeepChem to predict toxicity across all 12 tasks.
Use ChemBERTa pretrained model from HuggingFace and fine-tune it on my custom dataset at 'activity.csv' to predict binding affinity.
Load a trained DeepChem model and make predictions on a list of new SMILES strings: 'CCO', 'CC(=O)O', 'c1ccccc1'. Return confidence scores.
Лучшие практики
- Используйте ScaffoldSplitter вместо случайного разбиения для молекулярных наборов данных, чтобы предотвратить утечку данных из-за похожих молекул
- Применяйте перенос обучения с предварительно обученными моделями, когда размер набора данных меньше 10 000 образцов
- Увеличивайте dropout (0.3-0.5) и используйте более простые модели для небольших наборов данных, чтобы предотвратить переобучение
Избегать
- Использование случайных train/test разбиений для молекулярных данных — приводит к утечке данных из-за похожих структур
- Обучение глубоких GNN на наборах данных меньше 1 000 образцов — высокий риск сильного переобучения
- Игнорирование дисбаланса классов в наборах токсичности — всегда проверяйте распределение задач перед обучением
Часто задаваемые вопросы
Какой фичеризатор мне использовать?
Как работать с небольшими наборами данных?
Какой сплиттер мне использовать?
Могу ли я использовать свой набор данных?
Какие предварительно обученные модели доступны?
Как улучшить производительность модели?
Сведения для разработчиков
Автор
K-Dense-AIЛицензия
MIT license
Репозиторий
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/deepchemСсылка
main
Структура файлов