deepchem
Prever propriedades moleculares para descoberta de fármacos
Também disponível em: K-Dense-AI
A descoberta de fármacos requer a previsão de propriedades moleculares como solubilidade e toxicidade. O DeepChem fornece modelos pré-treinados e redes neurais de grafos para prever essas propriedades a partir de estruturas moleculares.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "deepchem". Predict solubility for caffeine using DeepChem
Resultado esperado:
- Predicted solubility for CN1C=NC2=C1C(=O)N(C(=O)N2C)C: -1.190 log(mol/L)
- Model: MultitaskRegressor with CircularFingerprint featurizer
- Dataset: Delaney benchmark, R²=0.89 on test set
A utilizar "deepchem". Train a GCN model on Tox21 dataset
Resultado esperado:
- Training GCN on 12 toxicity prediction tasks
- Using scaffold splitting to prevent data leakage
- Test ROC-AUC: 0.782 average across all tasks
Auditoria de Segurança
Baixo RiscoLegitimate molecular ML toolkit with standard ML library behaviors. Downloads pretrained models from HuggingFace and saves checkpoints locally. No suspicious network endpoints, credential access, or code execution patterns. Static findings are false positives from markdown documentation parsing.
Problemas de Risco Médio (1)
Problemas de Baixo Risco (1)
Fatores de risco
⚡ Contém scripts (3)
🌐 Acesso à rede (1)
📁 Acesso ao sistema de arquivos (2)
⚙️ Comandos externos (3)
Pontuação de qualidade
O Que Você Pode Construir
Triagem de bibliotecas de compostos
Prever propriedades ADMET para grandes bibliotecas de compostos a fim de priorizar candidatos para síntese.
Construção de modelos preditivos
Treinar modelos personalizados de previsão de propriedades usando seus dados químicos proprietários.
Previsão de propriedades de materiais
Aplicar redes neurais de grafos de cristais para prever bandgap, energia de formação e outras propriedades de materiais.
Tente Estes Prompts
Use DeepChem to predict aqueous solubility for these SMILES: CCO, CC(=O)O, c1ccccc1, CN1C=NC2=C1C(=O)N(C(=O)N2C)C
Train a GCN model on my molecules.csv file to predict activity. The SMILES column is 'smiles' and target column is 'target'. Use ScaffoldSplitter for data splitting.
Fine-tune ChemBERTa on the BBBP dataset using DeepChem. Use scaffold splitting and evaluate with ROC-AUC score.
Evaluate GCN, GAT, and AttentiveFP models on Tox21 dataset using DeepChem. Compare ROC-AUC scores and report the best performing architecture.
Melhores Práticas
- Use ScaffoldSplitter para dados moleculares para evitar vazamento de dados de estruturas semelhantes
- Aplicar transformadores de normalização a características e alvos para melhor convergência do modelo
- Começar com modelos mais simples (Random Forest + CircularFingerprint) antes de escalar para aprendizado profundo
Evitar
- Usar divisão aleatória para conjuntos de dados moleculares causa vazamento de dados de compostos semelhantes
- Treinar redes neurais profundas em conjuntos de dados pequenos (<1000 amostras) leva a overfitting
- Ignorar a normalização de dados reduz o desempenho do modelo e a estabilidade do treinamento
Perguntas Frequentes
Qual featurizer devo usar?
Quais recursos computacionais preciso?
Como instalo o DeepChem?
Meus dados estão seguros ao usar modelos pré-treinados?
Por que meu modelo está com desempenho inferior?
Como isso se compara a outros frameworks de ML?
Detalhes do Desenvolvedor
Autor
davila7Licença
MIT
Repositório
https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/deepchemReferência
main
Estrutura de arquivos