🧪

datamol

Name: datamol
Author: K-Dense-AI

Seguro ⚡ Contiene scripts📁 Acceso al sistema de archivos

Analizar estructuras moleculares con Datamol

También disponible en: davila7

Procesa datos químicos de manera eficiente con una interfaz Pythonica para RDKit. Datamol simplifica operaciones complejas de quimiología informática manteniendo la compatibilidad total con el ecosistema RDKit.

Soporta: Claude Codex Code(CC)

📊 70 Adecuado

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "datamol". Estandariza estas SMILES: OCCO, C(CO)O, ethanol

Resultado esperado:

OCCO → CCO (SMILES canónico para etanol)
C(CO)O → CCO (misma molécula, representación diferente)
ethanol → None (SMILES inválido, devuelve None)
Todas las representaciones válidas de etanol se estandarizan a la misma forma canónica

Usando "datamol". Calcular descriptores para cafeína

Resultado esperado:

Peso molecular: 194.19 g/mol
LogP: 0.61
Donadores de enlaces de hidrógeno: 0
Aceptadores de enlaces de hidrógeno: 6
TPSA: 58.44 Å²
Número de átomos aromáticos: 5

Usando "datamol". Encontrar moléculas similares a aspirina

Resultado esperado:

Huellas digitales ECFP4 generadas para consulta y biblioteca
Matriz de similitud Tanimoto calculada
Top 5 de moléculas más similares identificadas
Puntuaciones de similitud oscilan entre 0.72 y 0.85
Estructuras alineadas visualizadas con etiquetas de actividad

Auditoría de seguridad

Seguro

v4 • 1/17/2026

All 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.

Archivos escaneados

3,724

Líneas analizadas

hallazgos

Auditorías totales

Factores de riesgo

⚡ Contiene scripts (1)

SKILL.md:1-704

📁 Acceso al sistema de archivos (1)

references/core_api.md:1

Auditado por: claude Ver historial de auditorías →

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

100

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Analizar bibliotecas de compuestos

Procesar y estandarizar conjuntos de datos moleculares, calcular propiedades de similitud a fármacos e identificar candidatos prometedores.

Análisis de similitud molecular

Generar huellas digitales, calcular matrices de similitud y agrupar compuestos para campañas de cribado virtual.

Ingeniería de características para ML

Extraer descriptores moleculares y huellas digitales como características para modelado predictivo en descubrimiento de fármacos.

Prueba estos prompts

Procesamiento básico de moléculas

Usa datamol para convertir estas cadenas SMILES a moléculas estandarizadas: CCO, c1ccccc1, CC(=O)O. Muestra el SMILES canónico para cada una.

Calcular propiedades moleculares

Calcula el peso molecular, logP, donadores y aceptadores de enlaces de hidrógeno para estas moléculas: aspirina (CC(=O)OC1=CC=CC=C1C(=O)O) y cafeína (CN1C=NC2=C1C(=O)N(C(=O)N2C)C).

Agrupar conjuntos de datos moleculares

Genera huellas digitales ECFP para estas moléculas y agrúpalas: benceno, tolueno, fenol, ácido benzoico, anilina. Usa similitud Tanimoto con corte de 0.3.

Análisis de conformeros 3D

Genera 50 conformeros para ciclohexano, agrúpalos por RMSD e identifica los conformeros más representativos. Calcula SASA para cada uno.

Mejores prácticas

Siempre estandariza las moléculas de fuentes externas antes del análisis
Usa procesamiento paralelo (n_jobs=-1) para conjuntos de datos grandes para mejorar el rendimiento
Verifica valores None después del análisis de moléculas para manejar entradas inválidas de manera elegante

Evitar

No omitas la estandarización cuando trabajes con datos moleculares externos
Evita la agrupación Butina completa para conjuntos de datos mayores a 1000 moléculas
No uses huellas digitales por defecto sin considerar tus necesidades específicas de similitud

Preguntas frecuentes

¿Qué es Datamol?

Datamol es una biblioteca de Python que proporciona una interfaz simplificada a RDKit para operaciones de quimiología informática molecular.

¿Necesito instalar RDKit por separado?

Sí, Datamol es un envoltorio alrededor de RDKit, por lo que necesitas tener ambos instalados: 'uv pip install datamol rdkit'.

¿Puede Datamol manejar conjuntos de datos moleculares grandes?

Sí, soporta procesamiento paralelo para la mayoría de las operaciones y puede manejar miles de moléculas de manera eficiente.

¿Qué formatos de archivo soporta Datamol?

SDF, SMILES, CSV, Excel, MOL, Mol2, PDB y archivos remotos mediante fsspec (S3, GCS, HTTP).

¿Cómo visualizo moléculas?

Usa dm.viz.to_image() para visualización básica o dm.viz.conformers() para visualización de conformeros 3D.

¿Es Datamol adecuado para aprendizaje automático?

Sí, proporciona descriptores moleculares y huellas digitales que pueden usarse como características para modelos de ML.

Detalles del desarrollador

Autor

K-Dense-AI

Licencia

Apache-2.0 license

Repositorio

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/datamol

Ref.

main

Estructura de archivos

📁 references/

📄 conformers_module.md

📄 core_api.md

📄 descriptors_viz.md

📄 fragments_scaffolds.md

📄 io_module.md

📄 reactions_data.md

📄 SKILL.md