🧪

datamol

Name: datamol
Author: davila7

Безопасно ⚙️ Внешние команды🌐 Доступ к сети

Анализ молекул и вычисление свойств лекарств с помощью Python

Также доступно от: K-Dense-AI

Работа с молекулярными данными в Python требует сложного кода RDKit. Datamol предоставляет простые функции для парсинга SMILES, вычисления свойств и анализа соединений.

Поддерживает: Claude Codex Code(CC)

📊 70 Адекватно

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «datamol». Calculate drug-likeness properties for aspirin (CC(=O)Oc1ccccc1C(=O)O)

Ожидаемый результат:

Molecular Weight: 180.16 g/mol
LogP: 1.19
Hydrogen Bond Donors: 1
Hydrogen Bond Acceptors: 4
TPSA: 63.6 square angstroms
Passes Lipinski Rule of Five: Yes

Использование «datamol». Extract the scaffold from ibuprofen

Ожидаемый результат:

Original SMILES: CC(C)Cc1ccc(C(C)C(=O)O)cc1
Murcko Scaffold: c1ccc(CC(=O)O)cc1
Generic Scaffold: c1ccccc1

Аудит безопасности

Безопасно

v5 • 1/17/2026

This skill is documentation-only, containing markdown files with Python code examples for the Datamol cheminformatics library. All 521 static findings are false positives caused by the scanner misinterpreting chemistry terminology and markdown code fences as security threats. No executable code, scripts, or malicious patterns exist.

Просканировано файлов

1,881

Проанализировано строк

находки

Всего аудитов

Факторы риска

⚙️ Внешние команды (361)

🌐 Доступ к сети (6)

references/io_module.md:99 skill-report.json:6 SKILL.md:129 SKILL.md:698 SKILL.md:699 SKILL.md:700

Проверено: claude Посмотреть историю аудитов →

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

100

Безопасность

Соответствие спецификации

Что вы можете построить

Фильтрация соединений по правилам лекарственноподобности

Применение фильтров правила пяти Липинского к библиотекам соединений путем вычисления молекулярной массы, LogP, а также доноров и акцепторов водородных связей.

Построение молекулярных признаков для ML-моделей

Генерация молекулярных отпечатков и вычисление таблиц дескрипторов для обучения моделей машинного обучения на химических наборах данных.

Анализ SAR путем кластеризации скаффолдов

Группировка соединений по скаффолдам Murcko, визуализация структурных серий и выявление паттернов активности в химических сериях.

Попробуйте эти промпты

Парсинг строки SMILES

Use datamol to parse this SMILES string and standardize it: CCO

Вычисление дескрипторов

Calculate molecular weight, LogP, and hydrogen bond counts for this compound using datamol: c1ccc(CC(=O)O)cc1

Кластеризация по сходству

Use datamol to cluster these SMILES by structural similarity with a Tanimoto cutoff of 0.3: [list of SMILES]

Генерация конформеров

Generate 20 low-energy 3D conformers for this molecule using datamol ETKDGv3 method: c1ccccc1CCO

Лучшие практики

Всегда стандартизируйте молекулы из внешних источников с помощью dm.standardize_mol перед анализом
Проверяйте значения None после парсинга строк SMILES, так как недействительные молекулы возвращают None
Используйте параметр n_jobs=-1 для параллельной обработки при работе с большими наборами соединений

Избегать

Не используйте кластеризацию Butina для наборов данных более 1000 молекул из-за ограничений памяти
Не пропускайте санитизацию молекул при загрузке данных из ненадежных источников
Не генерируйте избыточное количество конформеров для крупных молекул, так как это приводит к медленной производительности

Часто задаваемые вопросы

В чём разница между datamol и RDKit?

Datamol является обёрткой вокруг RDKit, которая предоставляет более простые вызовы функций и разумные настройки по умолчанию. Все молекулы datamol являются нативными объектами Mol RDKit.

Как установить datamol?

Выполните 'uv pip install datamol' или 'pip install datamol'. RDKit устанавливается автоматически как зависимость.

Может ли datamol читать файлы из облачного хранилища?

Да, datamol использует fsspec для файлового ввода-вывода. Вы можете читать из S3, GCS или HTTP URL напрямую, передавая URL в функции чтения.

Какой тип отпечатка следует использовать для поиска по сходству?

ECFP (Extended Connectivity Fingerprints) с радиусом 2 является настройкой по умолчанию и хорошо работает для общего структурного сходства.

Как фильтровать соединения по правилу пяти Липинского?

Используйте dm.descriptors.compute_many_descriptors для получения значений mw, logp, hbd и hba, затем фильтруйте по стандартным порогам.

Почему моя кластеризация исчерпывает память?

Кластеризация Butina строит полную матрицу расстояний. Используйте dm.pick_diverse для наборов данных более 1000 молекул вместо этого.

Сведения для разработчиков

Автор

davila7

Лицензия

Apache-2.0

Репозиторий

https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/datamol

Ссылка

main

Структура файлов

📁 references/

📄 conformers_module.md

📄 core_api.md

📄 descriptors_viz.md

📄 fragments_scaffolds.md

📄 io_module.md

📄 reactions_data.md

📄 SKILL.md