Question 1

¿Cuál es la diferencia entre calculadores y transformadores en molfeat?

Accepted Answer

Los calculadores (molfeat.calc) procesan moléculas individuales y devuelven vectores de características. Los transformadores (molfeat.trans) envuelven calculadores para procesamiento por lotes con compatibilidad con scikit-learn y paralelización. Usa calculadores para bucles personalizados, transformadores para pipelines.

Question 2

¿Con qué featurizer debería comenzar para modelado QSAR?

Accepted Answer

ECFP4 (Extended-Connectivity Fingerprint con radio 2) es el punto de partida más popular. Captura subestructuras circulares alrededor de cada átomo y funciona bien con la mayoría de los algoritmos de ML. Para modelos interpretables, prueba los descriptores RDKit 2D.

Question 3

¿Cómo manejo conjuntos de datos grandes con molfeat?

Accepted Answer

Usa MoleculeTransformer con n_jobs=-1 para procesamiento paralelo. Para conjuntos de datos muy grandes, procesa en fragmentos usando un patrón de generador. Habilita ignore_errors=True para omitir moléculas inválidas. Cachea modelos preentrenados para evitar descargas repetidas.

Question 4

¿Se puede usar molfeat con pipelines de scikit-learn?

Accepted Answer

Sí. MoleculeTransformer es un transformador compatible con scikit-learn. Puedes incluirlo directamente en objetos Pipeline junto con clasificadores o regresores para flujos de trabajo de extremo a extremo desde SMILES hasta predicciones.

Question 5

¿Qué modelos preentrenados están disponibles en molfeat?

Accepted Answer

Molfeat incluye ChemBERTa (77M compuestos), ChemGPT (autoregresivo), Graphormer (química cuántica) y modelos GIN. Ver modelos disponibles con ModelStore().available_models o buscar por nombre.

Question 6

¿Cómo guardo y recargo una configuración de featurizer?

Accepted Answer

Usa transformer.to_state_yaml_file('config.yml') para guardar. Recarga con MoleculeTransformer.from_state_yaml_file('config.yml'). Esto preserva todos los parámetros para resultados reproducibles entre sesiones.

molfeat

Pruébalo

Auditoría de seguridad

Factores de riesgo

Puntuación de calidad

Lo que puedes crear

Construir modelos de predicción QSAR

Cribar bibliotecas de compuestos

Encontrar moléculas similares

Prueba estos prompts

Mejores prácticas

Evitar

Preguntas frecuentes

Detalles del desarrollador