🧪

datamol

Name: datamol
Author: K-Dense-AI

Seguro ⚡ Contém scripts📁 Acesso ao sistema de arquivos

Analisar estruturas moleculares com Datamol

Também disponível em: davila7

Processe dados químicos de forma eficiente com uma interface Pythonic para RDKit. Datamol simplifica operações complexas de quimioinformática, mantendo total compatibilidade com o ecossistema RDKit.

Suporta: Claude Codex Code(CC)

📊 70 Adequado

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "datamol". Padronize estes SMILES: OCCO, C(CO)O, ethanol

Resultado esperado:

OCCO → CCO (SMILES canônico para etanol)
C(CO)O → CCO (mesma molécula, representação diferente)
ethanol → None (SMILES inválido, retorna None)
Todas as representações válidas de etanol são padronizadas para a mesma forma canônica

A utilizar "datamol". Calcular descritores para cafeína

Resultado esperado:

Peso molecular: 194,19 g/mol
LogP: 0,61
Doadores de ligação de hidrogênio: 0
Aceptores de ligação de hidrogênio: 6
TPSA: 58,44 Å²
Número de átomos aromáticos: 5

A utilizar "datamol". Encontrar moléculas similares à aspirina

Resultado esperado:

Geradas impressões digitais ECFP4 para consulta e biblioteca
Calculada matriz de similaridade de Tanimoto
Identificadas as 5 moléculas mais similares
Pontuações de similaridade variam de 0,72 a 0,85
Visualizadas estruturas alinhadas com rótulos de atividade

Auditoria de Segurança

Seguro

v4 • 1/17/2026

All 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.

Arquivos analisados

3,724

Linhas analisadas

achados

Total de auditorias

Fatores de risco

⚡ Contém scripts (1)

SKILL.md:1-704

📁 Acesso ao sistema de arquivos (1)

references/core_api.md:1

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Analisar bibliotecas de compostos

Processe e padronize conjuntos de dados moleculares, calcule propriedades de similitude a drugs e identifique candidatos promissores.

Análise de similaridade molecular

Gere impressões digitais, calcule matrizes de similaridade e agrupe compostos para campanhas de triagem virtual.

Engenharia de atributos para ML

Extraia descritores e impressões digitais moleculares como atributos para modelagem preditiva na descoberta de drugs.

Tente Estes Prompts

Processamento básico de moléculas

Use datamol para converter estas strings SMILES em moléculas padronizadas: CCO, c1ccccc1, CC(=O)O. Mostre o SMILES canônico para cada uma.

Calcular propriedades moleculares

Calcule peso molecular, logP, doadores e aceptores de ligação de hidrogênio para estas moléculas: aspirina (CC(=O)OC1=CC=CC=C1C(=O)O) e cafeína (CN1C=NC2=C1C(=O)N(C(=O)N2C)C).

Agrupar conjuntos de dados moleculares

Gere impressões digitais ECFP para estas moléculas e agrupe-as: benzeno, tolueno, fenol, ácido benzóico, anilina. Use similaridade de Tanimoto com limite de 0,3.

Análise de confôrmeros 3D

Gere 50 confôrmeros para ciclo-hexano, agrupe-os por RMSD e identifique os confôrmeros mais representativos. Calcule SASA para cada um.

Melhores Práticas

Sempre padronize moléculas de fontes externas antes da análise
Use processamento paralelo (n_jobs=-1) para grandes conjuntos de dados para melhorar o desempenho
Verifique valores None após o解析 de moléculas para lidar graciosamente com entradas inválidas

Evitar

Não pule a padronização ao trabalhar com dados moleculares externos
Evite agrupamento Butina completo para conjuntos de dados maiores que 1000 moléculas
Não use impressões digitais padrão sem considerar suas necessidades específicas de similaridade

Perguntas Frequentes

O que é Datamol?

Datamol é uma biblioteca Python que fornece uma interface simplificada para RDKit para operações de quimioinformática molecular.

Preciso instalar o RDKit separadamente?

Sim, Datamol é um wrapper em torno do RDKit, então você precisa de ambos instalados: 'uv pip install datamol rdkit'.

Datamol pode lidar com grandes conjuntos de dados moleculares?

Sim, ele oferece processamento paralelo para a maioria das operações e pode lidar com milhares de moléculas de forma eficiente.

Quais formatos de arquivo o Datamol suporta?

SDF, SMILES, CSV, Excel, MOL, Mol2, PDB e arquivos remotos via fsspec (S3, GCS, HTTP).

Como visualizo moléculas?

Use dm.viz.to_image() para visualização básica ou dm.viz.conformers() para visualização de confôrmeros 3D.

Datamol é adequado para aprendizado de máquina?

Sim, ele fornece descritores e impressões digitais moleculares que podem ser usados como atributos para modelos de ML.

Detalhes do Desenvolvedor

Autor

K-Dense-AI

Licença

Apache-2.0 license

Repositório

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/datamol

Referência

main

Estrutura de arquivos

📁 references/

📄 conformers_module.md

📄 core_api.md

📄 descriptors_viz.md

📄 fragments_scaffolds.md

📄 io_module.md

📄 reactions_data.md

📄 SKILL.md