deepchem
Aplicar aprendizado de máquina à química e descoberta de medicamentos
Também disponível em: davila7
Prever propriedades moleculares como solubilidade, toxicidade e afinidade de ligação usando DeepChem. Treinar redes neurais gráficas ou usar modelos pré-treinados como ChemBERTa para descoberta de medicamentos e aplicações em ciência dos materiais.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "deepchem". Prever solubilidade para estas moléculas: 'CCO', 'CC(=O)O', 'c1ccccc1'
Resultado esperado:
- Previsões de solubilidade (log mol/L):
- • Etanol (CCO): -0,92
- • Ácido acético (CC(=O)O): -0,45
- • Benzeno (c1ccccc1): -1,69
- Nota: Valores menores indicam menor solubilidade em água.
Auditoria de Segurança
SeguroThis is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.
Fatores de risco
⚡ Contém scripts (3)
📁 Acesso ao sistema de arquivos (3)
🌐 Acesso à rede (1)
Pontuação de qualidade
O Que Você Pode Construir
Filtrar bibliotecas de compostos
Prever solubilidade e toxicidade para bibliotecas de compostos grandes para priorizar candidatos para síntese.
Construir modelos de propriedades moleculares
Treinar modelos personalizados em conjuntos de dados proprietários usando redes neurais gráficas ou algoritmos tradicionais de ML.
Aplicar transfer learning
Fine-tune de modelos pré-treinados de química como ChemBERTa em conjuntos de dados pequenos com exemplos rotulados limitados.
Tente Estes Prompts
Usar DeepChem para carregar um arquivo CSV com strings SMILES em 'molecules.csv' e prever solubilidade usando featurizer CircularFingerprint e um modelo treinado.
Treinar uma Graph Convolutional Network no conjunto de dados Tox21 usando DeepChem para prever toxicidade em todas as 12 tarefas.
Usar modelo pré-treinado ChemBERTa do HuggingFace e fazer fine-tune no meu conjunto de dados personalizado em 'activity.csv' para prever afinidade de ligação.
Carregar um modelo DeepChem treinado e fazer previsões em uma lista de novas strings SMILES: 'CCO', 'CC(=O)O', 'c1ccccc1'. Retornar escores de confiança.
Melhores Práticas
- Usar ScaffoldSplitter em vez de divisão aleatória para conjuntos de dados moleculares para evitar vazamento de dados de moléculas semelhantes
- Aplicar transfer learning com modelos pré-treinados quando o tamanho do conjunto de dados é menor que 10.000 amostras
- Aumentar dropout (0,3-0,5) e usar modelos mais simples para conjuntos de dados pequenos para evitar overfitting
Evitar
- Usar divisões aleatórias de treino/teste em dados moleculares - leva a vazamento de dados de estruturas semelhantes
- Treinar GNNs profundas em conjuntos de dados menores que 1.000 amostras - risco severo de overfitting
- Ignorar desbalanceamento de classes em conjuntos de dados de toxicidade - sempre verificar distribuição das tarefas antes do treinamento
Perguntas Frequentes
Qual featurizer devo usar?
Como lidar com conjuntos de dados pequenos?
Qual divisor devo usar?
Posso usar meu próprio conjunto de dados?
Quais modelos pré-treinados estão disponíveis?
Como melhorar o desempenho do modelo?
Detalhes do Desenvolvedor
Autor
K-Dense-AILicença
MIT license
Repositório
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/deepchemReferência
main
Estrutura de arquivos