🧪

deepchem

Name: deepchem
Author: K-Dense-AI

Безопасно ⚡ Содержит скрипты📁 Доступ к файловой системе🌐 Доступ к сети

Применяйте машинное обучение в химии и разработке лекарств

Также доступно от: davila7

Предсказывайте молекулярные свойства, такие как растворимость, токсичность и аффинность связывания, с помощью DeepChem. Обучайте графовые нейронные сети или используйте предварительно обученные модели вроде ChemBERTa для задач разработки лекарств и материаловедения.

Поддерживает: Claude Codex Code(CC)

🥉 75 Бронза

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «deepchem». Predict solubility for these molecules: 'CCO', 'CC(=O)O', 'c1ccccc1'

Ожидаемый результат:

Predictions of solubility (log mol/L):
• Ethanol (CCO): -0.92
• Acetic acid (CC(=O)O): -0.45
• Benzene (c1ccccc1): -1.69
Note: Lower values indicate lower aqueous solubility.

Аудит безопасности

Безопасно

v4 • 1/17/2026

This is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.

Просканировано файлов

2,764

Проанализировано строк

находки

Всего аудитов

Факторы риска

⚡ Содержит скрипты (3)

scripts/graph_neural_network.py:1-339 scripts/predict_solubility.py:1-225 scripts/transfer_learning.py:1-376

📁 Доступ к файловой системе (3)

scripts/graph_neural_network.py:55-65 scripts/predict_solubility.py:45-55 scripts/transfer_learning.py:50-60

🌐 Доступ к сети (1)

SKILL.md:245-255

Проверено: claude Посмотреть историю аудитов →

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

100

Безопасность

Соответствие спецификации

Что вы можете построить

Скрининг библиотек соединений

Предсказывайте растворимость и токсичность для больших библиотек соединений, чтобы приоритизировать кандидатов для синтеза.

Построение моделей молекулярных свойств

Обучайте пользовательские модели на проприетарных наборах данных с использованием графовых нейронных сетей или традиционных ML-алгоритмов.

Применение переноса обучения

Дообучайте предварительно обученные химические модели вроде ChemBERTa на небольших наборах данных с ограниченным числом размеченных примеров.

Попробуйте эти промпты

Загрузка молекулярных данных

Use DeepChem to load a CSV file with SMILES strings at 'molecules.csv' and predict solubility using CircularFingerprint featurizer and a trained model.

Обучение модели GNN

Train a Graph Convolutional Network on the Tox21 dataset using DeepChem to predict toxicity across all 12 tasks.

Перенос обучения

Use ChemBERTa pretrained model from HuggingFace and fine-tune it on my custom dataset at 'activity.csv' to predict binding affinity.

Пакетные предсказания

Load a trained DeepChem model and make predictions on a list of new SMILES strings: 'CCO', 'CC(=O)O', 'c1ccccc1'. Return confidence scores.

Лучшие практики

Используйте ScaffoldSplitter вместо случайного разбиения для молекулярных наборов данных, чтобы предотвратить утечку данных из-за похожих молекул
Применяйте перенос обучения с предварительно обученными моделями, когда размер набора данных меньше 10 000 образцов
Увеличивайте dropout (0.3-0.5) и используйте более простые модели для небольших наборов данных, чтобы предотвратить переобучение

Избегать

Использование случайных train/test разбиений для молекулярных данных — приводит к утечке данных из-за похожих структур
Обучение глубоких GNN на наборах данных меньше 1 000 образцов — высокий риск сильного переобучения
Игнорирование дисбаланса классов в наборах токсичности — всегда проверяйте распределение задач перед обучением

Часто задаваемые вопросы

Какой фичеризатор мне использовать?

Используйте MolGraphConvFeaturizer для GNN, CircularFingerprint для традиционного ML и RDKitDescriptors для интерпретируемых моделей.

Как работать с небольшими наборами данных?

Применяйте перенос обучения с предварительно обученными моделями ChemBERTa или GROVER. Используйте аугментацию данных и более сильную регуляризацию.

Какой сплиттер мне использовать?

Используйте ScaffoldSplitter для молекулярных наборов данных, чтобы структурно похожие соединения оставались в одном разбиении.

Могу ли я использовать свой набор данных?

Да, предоставьте CSV со строками SMILES в одной колонке и целевыми значениями в другой. Используйте CSVLoader с пользовательскими именами колонок.

Какие предварительно обученные модели доступны?

ChemBERTa, GROVER и MolFormer интегрированы. Загружайте из HuggingFace для предметно-ориентированных молекулярных представлений.

Как улучшить производительность модели?

Пробуйте разные фичеризаторы, увеличивайте число эпох обучения, используйте более крупные модели вроде AttentiveFP или применяйте перенос обучения с предварительно обученных моделей.