datamol
Analisar estruturas moleculares com Datamol
Também disponível em: davila7
Processe dados químicos de forma eficiente com uma interface Pythonic para RDKit. Datamol simplifica operações complexas de quimioinformática, mantendo total compatibilidade com o ecossistema RDKit.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "datamol". Padronize estes SMILES: OCCO, C(CO)O, ethanol
Resultado esperado:
- OCCO → CCO (SMILES canônico para etanol)
- C(CO)O → CCO (mesma molécula, representação diferente)
- ethanol → None (SMILES inválido, retorna None)
- Todas as representações válidas de etanol são padronizadas para a mesma forma canônica
A utilizar "datamol". Calcular descritores para cafeína
Resultado esperado:
- Peso molecular: 194,19 g/mol
- LogP: 0,61
- Doadores de ligação de hidrogênio: 0
- Aceptores de ligação de hidrogênio: 6
- TPSA: 58,44 Ų
- Número de átomos aromáticos: 5
A utilizar "datamol". Encontrar moléculas similares à aspirina
Resultado esperado:
- Geradas impressões digitais ECFP4 para consulta e biblioteca
- Calculada matriz de similaridade de Tanimoto
- Identificadas as 5 moléculas mais similares
- Pontuações de similaridade variam de 0,72 a 0,85
- Visualizadas estruturas alinhadas com rótulos de atividade
Auditoria de Segurança
SeguroAll 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.
Fatores de risco
⚡ Contém scripts (1)
📁 Acesso ao sistema de arquivos (1)
Pontuação de qualidade
O Que Você Pode Construir
Analisar bibliotecas de compostos
Processe e padronize conjuntos de dados moleculares, calcule propriedades de similitude a drugs e identifique candidatos promissores.
Análise de similaridade molecular
Gere impressões digitais, calcule matrizes de similaridade e agrupe compostos para campanhas de triagem virtual.
Engenharia de atributos para ML
Extraia descritores e impressões digitais moleculares como atributos para modelagem preditiva na descoberta de drugs.
Tente Estes Prompts
Use datamol para converter estas strings SMILES em moléculas padronizadas: CCO, c1ccccc1, CC(=O)O. Mostre o SMILES canônico para cada uma.
Calcule peso molecular, logP, doadores e aceptores de ligação de hidrogênio para estas moléculas: aspirina (CC(=O)OC1=CC=CC=C1C(=O)O) e cafeína (CN1C=NC2=C1C(=O)N(C(=O)N2C)C).
Gere impressões digitais ECFP para estas moléculas e agrupe-as: benzeno, tolueno, fenol, ácido benzóico, anilina. Use similaridade de Tanimoto com limite de 0,3.
Gere 50 confôrmeros para ciclo-hexano, agrupe-os por RMSD e identifique os confôrmeros mais representativos. Calcule SASA para cada um.
Melhores Práticas
- Sempre padronize moléculas de fontes externas antes da análise
- Use processamento paralelo (n_jobs=-1) para grandes conjuntos de dados para melhorar o desempenho
- Verifique valores None após o解析 de moléculas para lidar graciosamente com entradas inválidas
Evitar
- Não pule a padronização ao trabalhar com dados moleculares externos
- Evite agrupamento Butina completo para conjuntos de dados maiores que 1000 moléculas
- Não use impressões digitais padrão sem considerar suas necessidades específicas de similaridade
Perguntas Frequentes
O que é Datamol?
Preciso instalar o RDKit separadamente?
Datamol pode lidar com grandes conjuntos de dados moleculares?
Quais formatos de arquivo o Datamol suporta?
Como visualizo moléculas?
Datamol é adequado para aprendizado de máquina?
Detalhes do Desenvolvedor
Autor
K-Dense-AILicença
Apache-2.0 license
Repositório
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/datamolReferência
main
Estrutura de arquivos