Habilidades deepchem
🧪

deepchem

Seguro ⚡ Contém scripts📁 Acesso ao sistema de arquivos🌐 Acesso à rede

Aplicar aprendizado de máquina à química e descoberta de medicamentos

Também disponível em: davila7

Prever propriedades moleculares como solubilidade, toxicidade e afinidade de ligação usando DeepChem. Treinar redes neurais gráficas ou usar modelos pré-treinados como ChemBERTa para descoberta de medicamentos e aplicações em ciência dos materiais.

Suporta: Claude Codex Code(CC)
🥉 76 Bronze
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "deepchem". Prever solubilidade para estas moléculas: 'CCO', 'CC(=O)O', 'c1ccccc1'

Resultado esperado:

  • Previsões de solubilidade (log mol/L):
  • • Etanol (CCO): -0,92
  • • Ácido acético (CC(=O)O): -0,45
  • • Benzeno (c1ccccc1): -1,69
  • Nota: Valores menores indicam menor solubilidade em água.

Auditoria de Segurança

Seguro
v4 • 1/17/2026

This is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.

8
Arquivos analisados
2,764
Linhas analisadas
3
achados
4
Total de auditorias
Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

64
Arquitetura
100
Manutenibilidade
83
Conteúdo
30
Comunidade
100
Segurança
87
Conformidade com especificações

O Que Você Pode Construir

Filtrar bibliotecas de compostos

Prever solubilidade e toxicidade para bibliotecas de compostos grandes para priorizar candidatos para síntese.

Construir modelos de propriedades moleculares

Treinar modelos personalizados em conjuntos de dados proprietários usando redes neurais gráficas ou algoritmos tradicionais de ML.

Aplicar transfer learning

Fine-tune de modelos pré-treinados de química como ChemBERTa em conjuntos de dados pequenos com exemplos rotulados limitados.

Tente Estes Prompts

Carregar dados moleculares
Usar DeepChem para carregar um arquivo CSV com strings SMILES em 'molecules.csv' e prever solubilidade usando featurizer CircularFingerprint e um modelo treinado.
Treinar modelo GNN
Treinar uma Graph Convolutional Network no conjunto de dados Tox21 usando DeepChem para prever toxicidade em todas as 12 tarefas.
Transfer learning
Usar modelo pré-treinado ChemBERTa do HuggingFace e fazer fine-tune no meu conjunto de dados personalizado em 'activity.csv' para prever afinidade de ligação.
Previsões em lote
Carregar um modelo DeepChem treinado e fazer previsões em uma lista de novas strings SMILES: 'CCO', 'CC(=O)O', 'c1ccccc1'. Retornar escores de confiança.

Melhores Práticas

  • Usar ScaffoldSplitter em vez de divisão aleatória para conjuntos de dados moleculares para evitar vazamento de dados de moléculas semelhantes
  • Aplicar transfer learning com modelos pré-treinados quando o tamanho do conjunto de dados é menor que 10.000 amostras
  • Aumentar dropout (0,3-0,5) e usar modelos mais simples para conjuntos de dados pequenos para evitar overfitting

Evitar

  • Usar divisões aleatórias de treino/teste em dados moleculares - leva a vazamento de dados de estruturas semelhantes
  • Treinar GNNs profundas em conjuntos de dados menores que 1.000 amostras - risco severo de overfitting
  • Ignorar desbalanceamento de classes em conjuntos de dados de toxicidade - sempre verificar distribuição das tarefas antes do treinamento

Perguntas Frequentes

Qual featurizer devo usar?
Use MolGraphConvFeaturizer para GNNs, CircularFingerprint para ML tradicional, e RDKitDescriptors para modelos interpretáveis.
Como lidar com conjuntos de dados pequenos?
Aplique transfer learning com modelos pré-treinados ChemBERTa ou GROVER. Use aumento de dados e regularização mais forte.
Qual divisor devo usar?
Use ScaffoldSplitter para conjuntos de dados moleculares para garantir que compostos estruturalmente semelhantes permaneçam na mesma divisão.
Posso usar meu próprio conjunto de dados?
Sim, forneça um CSV com strings SMILES em uma coluna e valores alvo em outra. Use CSVLoader com nomes de colunas personalizados.
Quais modelos pré-treinados estão disponíveis?
ChemBERTa, GROVER e MolFormar são integrados. Carregue do HuggingFace para representações moleculares específicas do domínio.
Como melhorar o desempenho do modelo?
Experimente diferentes featurizers, aumente epochs de treinamento, use modelos maiores como AttentiveFP, ou aplique transfer learning de modelos pré-treinados.

Detalhes do Desenvolvedor