🧪

deepchem

Name: deepchem
Author: K-Dense-AI

Seguro ⚡ Contém scripts📁 Acesso ao sistema de arquivos🌐 Acesso à rede

Aplicar aprendizado de máquina à química e descoberta de medicamentos

Também disponível em: davila7

Prever propriedades moleculares como solubilidade, toxicidade e afinidade de ligação usando DeepChem. Treinar redes neurais gráficas ou usar modelos pré-treinados como ChemBERTa para descoberta de medicamentos e aplicações em ciência dos materiais.

Suporta: Claude Codex Code(CC)

🥉 75 Bronze

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "deepchem". Prever solubilidade para estas moléculas: 'CCO', 'CC(=O)O', 'c1ccccc1'

Resultado esperado:

Previsões de solubilidade (log mol/L):
• Etanol (CCO): -0,92
• Ácido acético (CC(=O)O): -0,45
• Benzeno (c1ccccc1): -1,69
Nota: Valores menores indicam menor solubilidade em água.

Auditoria de Segurança

Seguro

v4 • 1/17/2026

This is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.

Arquivos analisados

2,764

Linhas analisadas

achados

Total de auditorias

Fatores de risco

⚡ Contém scripts (3)

scripts/graph_neural_network.py:1-339 scripts/predict_solubility.py:1-225 scripts/transfer_learning.py:1-376

📁 Acesso ao sistema de arquivos (3)

scripts/graph_neural_network.py:55-65 scripts/predict_solubility.py:45-55 scripts/transfer_learning.py:50-60

🌐 Acesso à rede (1)

SKILL.md:245-255

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Filtrar bibliotecas de compostos

Prever solubilidade e toxicidade para bibliotecas de compostos grandes para priorizar candidatos para síntese.

Construir modelos de propriedades moleculares

Treinar modelos personalizados em conjuntos de dados proprietários usando redes neurais gráficas ou algoritmos tradicionais de ML.

Aplicar transfer learning

Fine-tune de modelos pré-treinados de química como ChemBERTa em conjuntos de dados pequenos com exemplos rotulados limitados.

Tente Estes Prompts

Carregar dados moleculares

Usar DeepChem para carregar um arquivo CSV com strings SMILES em 'molecules.csv' e prever solubilidade usando featurizer CircularFingerprint e um modelo treinado.

Treinar modelo GNN

Treinar uma Graph Convolutional Network no conjunto de dados Tox21 usando DeepChem para prever toxicidade em todas as 12 tarefas.

Transfer learning

Usar modelo pré-treinado ChemBERTa do HuggingFace e fazer fine-tune no meu conjunto de dados personalizado em 'activity.csv' para prever afinidade de ligação.

Previsões em lote

Carregar um modelo DeepChem treinado e fazer previsões em uma lista de novas strings SMILES: 'CCO', 'CC(=O)O', 'c1ccccc1'. Retornar escores de confiança.

Melhores Práticas

Usar ScaffoldSplitter em vez de divisão aleatória para conjuntos de dados moleculares para evitar vazamento de dados de moléculas semelhantes
Aplicar transfer learning com modelos pré-treinados quando o tamanho do conjunto de dados é menor que 10.000 amostras
Aumentar dropout (0,3-0,5) e usar modelos mais simples para conjuntos de dados pequenos para evitar overfitting

Evitar

Usar divisões aleatórias de treino/teste em dados moleculares - leva a vazamento de dados de estruturas semelhantes
Treinar GNNs profundas em conjuntos de dados menores que 1.000 amostras - risco severo de overfitting
Ignorar desbalanceamento de classes em conjuntos de dados de toxicidade - sempre verificar distribuição das tarefas antes do treinamento

Perguntas Frequentes

Qual featurizer devo usar?

Use MolGraphConvFeaturizer para GNNs, CircularFingerprint para ML tradicional, e RDKitDescriptors para modelos interpretáveis.

Como lidar com conjuntos de dados pequenos?

Aplique transfer learning com modelos pré-treinados ChemBERTa ou GROVER. Use aumento de dados e regularização mais forte.

Qual divisor devo usar?

Use ScaffoldSplitter para conjuntos de dados moleculares para garantir que compostos estruturalmente semelhantes permaneçam na mesma divisão.

Posso usar meu próprio conjunto de dados?

Sim, forneça um CSV com strings SMILES em uma coluna e valores alvo em outra. Use CSVLoader com nomes de colunas personalizados.

Quais modelos pré-treinados estão disponíveis?

ChemBERTa, GROVER e MolFormar são integrados. Carregue do HuggingFace para representações moleculares específicas do domínio.

Como melhorar o desempenho do modelo?

Experimente diferentes featurizers, aumente epochs de treinamento, use modelos maiores como AttentiveFP, ou aplique transfer learning de modelos pré-treinados.