datamol
Анализ молекул и вычисление свойств лекарств с помощью Python
Также доступно от: K-Dense-AI
Работа с молекулярными данными в Python требует сложного кода RDKit. Datamol предоставляет простые функции для парсинга SMILES, вычисления свойств и анализа соединений.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «datamol». Calculate drug-likeness properties for aspirin (CC(=O)Oc1ccccc1C(=O)O)
Ожидаемый результат:
- Molecular Weight: 180.16 g/mol
- LogP: 1.19
- Hydrogen Bond Donors: 1
- Hydrogen Bond Acceptors: 4
- TPSA: 63.6 square angstroms
- Passes Lipinski Rule of Five: Yes
Использование «datamol». Extract the scaffold from ibuprofen
Ожидаемый результат:
- Original SMILES: CC(C)Cc1ccc(C(C)C(=O)O)cc1
- Murcko Scaffold: c1ccc(CC(=O)O)cc1
- Generic Scaffold: c1ccccc1
Аудит безопасности
БезопасноThis skill is documentation-only, containing markdown files with Python code examples for the Datamol cheminformatics library. All 521 static findings are false positives caused by the scanner misinterpreting chemistry terminology and markdown code fences as security threats. No executable code, scripts, or malicious patterns exist.
Факторы риска
⚙️ Внешние команды (361)
🌐 Доступ к сети (6)
Оценка качества
Что вы можете построить
Фильтрация соединений по правилам лекарственноподобности
Применение фильтров правила пяти Липинского к библиотекам соединений путем вычисления молекулярной массы, LogP, а также доноров и акцепторов водородных связей.
Построение молекулярных признаков для ML-моделей
Генерация молекулярных отпечатков и вычисление таблиц дескрипторов для обучения моделей машинного обучения на химических наборах данных.
Анализ SAR путем кластеризации скаффолдов
Группировка соединений по скаффолдам Murcko, визуализация структурных серий и выявление паттернов активности в химических сериях.
Попробуйте эти промпты
Use datamol to parse this SMILES string and standardize it: CCO
Calculate molecular weight, LogP, and hydrogen bond counts for this compound using datamol: c1ccc(CC(=O)O)cc1
Use datamol to cluster these SMILES by structural similarity with a Tanimoto cutoff of 0.3: [list of SMILES]
Generate 20 low-energy 3D conformers for this molecule using datamol ETKDGv3 method: c1ccccc1CCO
Лучшие практики
- Всегда стандартизируйте молекулы из внешних источников с помощью dm.standardize_mol перед анализом
- Проверяйте значения None после парсинга строк SMILES, так как недействительные молекулы возвращают None
- Используйте параметр n_jobs=-1 для параллельной обработки при работе с большими наборами соединений
Избегать
- Не используйте кластеризацию Butina для наборов данных более 1000 молекул из-за ограничений памяти
- Не пропускайте санитизацию молекул при загрузке данных из ненадежных источников
- Не генерируйте избыточное количество конформеров для крупных молекул, так как это приводит к медленной производительности
Часто задаваемые вопросы
В чём разница между datamol и RDKit?
Как установить datamol?
Может ли datamol читать файлы из облачного хранилища?
Какой тип отпечатка следует использовать для поиска по сходству?
Как фильтровать соединения по правилу пяти Липинского?
Почему моя кластеризация исчерпывает память?
Сведения для разработчиков
Автор
davila7Лицензия
Apache-2.0
Репозиторий
https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/datamolСсылка
main
Структура файлов