datamol
Analizar estructuras moleculares con Datamol
También disponible en: davila7
Procesa datos químicos de manera eficiente con una interfaz Pythonica para RDKit. Datamol simplifica operaciones complejas de quimiología informática manteniendo la compatibilidad total con el ecosistema RDKit.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "datamol". Estandariza estas SMILES: OCCO, C(CO)O, ethanol
Resultado esperado:
- OCCO → CCO (SMILES canónico para etanol)
- C(CO)O → CCO (misma molécula, representación diferente)
- ethanol → None (SMILES inválido, devuelve None)
- Todas las representaciones válidas de etanol se estandarizan a la misma forma canónica
Usando "datamol". Calcular descriptores para cafeína
Resultado esperado:
- Peso molecular: 194.19 g/mol
- LogP: 0.61
- Donadores de enlaces de hidrógeno: 0
- Aceptadores de enlaces de hidrógeno: 6
- TPSA: 58.44 Ų
- Número de átomos aromáticos: 5
Usando "datamol". Encontrar moléculas similares a aspirina
Resultado esperado:
- Huellas digitales ECFP4 generadas para consulta y biblioteca
- Matriz de similitud Tanimoto calculada
- Top 5 de moléculas más similares identificadas
- Puntuaciones de similitud oscilan entre 0.72 y 0.85
- Estructuras alineadas visualizadas con etiquetas de actividad
Auditoría de seguridad
SeguroAll 593 static findings are false positives. This is a documentation-only skill containing markdown files with Python code examples. The analyzer misinterpreted markdown code formatting (backticks) as shell commands, chemistry terminology as cryptographic patterns, and RDKit method calls as system reconnaissance. No actual security vulnerabilities exist.
Factores de riesgo
⚡ Contiene scripts (1)
📁 Acceso al sistema de archivos (1)
Puntuación de calidad
Lo que puedes crear
Analizar bibliotecas de compuestos
Procesar y estandarizar conjuntos de datos moleculares, calcular propiedades de similitud a fármacos e identificar candidatos prometedores.
Análisis de similitud molecular
Generar huellas digitales, calcular matrices de similitud y agrupar compuestos para campañas de cribado virtual.
Ingeniería de características para ML
Extraer descriptores moleculares y huellas digitales como características para modelado predictivo en descubrimiento de fármacos.
Prueba estos prompts
Usa datamol para convertir estas cadenas SMILES a moléculas estandarizadas: CCO, c1ccccc1, CC(=O)O. Muestra el SMILES canónico para cada una.
Calcula el peso molecular, logP, donadores y aceptadores de enlaces de hidrógeno para estas moléculas: aspirina (CC(=O)OC1=CC=CC=C1C(=O)O) y cafeína (CN1C=NC2=C1C(=O)N(C(=O)N2C)C).
Genera huellas digitales ECFP para estas moléculas y agrúpalas: benceno, tolueno, fenol, ácido benzoico, anilina. Usa similitud Tanimoto con corte de 0.3.
Genera 50 conformeros para ciclohexano, agrúpalos por RMSD e identifica los conformeros más representativos. Calcula SASA para cada uno.
Mejores prácticas
- Siempre estandariza las moléculas de fuentes externas antes del análisis
- Usa procesamiento paralelo (n_jobs=-1) para conjuntos de datos grandes para mejorar el rendimiento
- Verifica valores None después del análisis de moléculas para manejar entradas inválidas de manera elegante
Evitar
- No omitas la estandarización cuando trabajes con datos moleculares externos
- Evita la agrupación Butina completa para conjuntos de datos mayores a 1000 moléculas
- No uses huellas digitales por defecto sin considerar tus necesidades específicas de similitud
Preguntas frecuentes
¿Qué es Datamol?
¿Necesito instalar RDKit por separado?
¿Puede Datamol manejar conjuntos de datos moleculares grandes?
¿Qué formatos de archivo soporta Datamol?
¿Cómo visualizo moléculas?
¿Es Datamol adecuado para aprendizaje automático?
Detalles del desarrollador
Autor
K-Dense-AILicencia
Apache-2.0 license
Repositorio
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/datamolRef.
main
Estructura de archivos