Fähigkeiten deepchem
🧪

deepchem

Sicher ⚡ Enthält Skripte📁 Dateisystemzugriff🌐 Netzwerkzugriff

Aplicar aprendizado de máquina à química e descoberta de medicamentos

Auch verfügbar von: davila7

Prever propriedades moleculares como solubilidade, toxicidade e afinidade de ligação usando DeepChem. Treinar redes neurais gráficas ou usar modelos pré-treinados como ChemBERTa para descoberta de medicamentos e aplicações em ciência dos materiais.

Unterstützt: Claude Codex Code(CC)
🥉 75 Bronze
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "deepchem". Prever solubilidade para estas moléculas: 'CCO', 'CC(=O)O', 'c1ccccc1'

Erwartetes Ergebnis:

  • Previsões de solubilidade (log mol/L):
  • • Etanol (CCO): -0,92
  • • Ácido acético (CC(=O)O): -0,45
  • • Benzeno (c1ccccc1): -1,69
  • Nota: Valores menores indicam menor solubilidade em água.

Sicherheitsaudit

Sicher
v4 • 1/17/2026

This is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.

8
Gescannte Dateien
2,764
Analysierte Zeilen
3
befunde
4
Gesamtzahl Audits
Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

64
Architektur
100
Wartbarkeit
83
Inhalt
20
Community
100
Sicherheit
87
Spezifikationskonformität

Was du bauen kannst

Filtrar bibliotecas de compostos

Prever solubilidade e toxicidade para bibliotecas de compostos grandes para priorizar candidatos para síntese.

Construir modelos de propriedades moleculares

Treinar modelos personalizados em conjuntos de dados proprietários usando redes neurais gráficas ou algoritmos tradicionais de ML.

Aplicar transfer learning

Fine-tune de modelos pré-treinados de química como ChemBERTa em conjuntos de dados pequenos com exemplos rotulados limitados.

Probiere diese Prompts

Carregar dados moleculares
Usar DeepChem para carregar um arquivo CSV com strings SMILES em 'molecules.csv' e prever solubilidade usando featurizer CircularFingerprint e um modelo treinado.
Treinar modelo GNN
Treinar uma Graph Convolutional Network no conjunto de dados Tox21 usando DeepChem para prever toxicidade em todas as 12 tarefas.
Transfer learning
Usar modelo pré-treinado ChemBERTa do HuggingFace e fazer fine-tune no meu conjunto de dados personalizado em 'activity.csv' para prever afinidade de ligação.
Previsões em lote
Carregar um modelo DeepChem treinado e fazer previsões em uma lista de novas strings SMILES: 'CCO', 'CC(=O)O', 'c1ccccc1'. Retornar escores de confiança.

Bewährte Verfahren

  • Usar ScaffoldSplitter em vez de divisão aleatória para conjuntos de dados moleculares para evitar vazamento de dados de moléculas semelhantes
  • Aplicar transfer learning com modelos pré-treinados quando o tamanho do conjunto de dados é menor que 10.000 amostras
  • Aumentar dropout (0,3-0,5) e usar modelos mais simples para conjuntos de dados pequenos para evitar overfitting

Vermeiden

  • Usar divisões aleatórias de treino/teste em dados moleculares - leva a vazamento de dados de estruturas semelhantes
  • Treinar GNNs profundas em conjuntos de dados menores que 1.000 amostras - risco severo de overfitting
  • Ignorar desbalanceamento de classes em conjuntos de dados de toxicidade - sempre verificar distribuição das tarefas antes do treinamento

Häufig gestellte Fragen

Qual featurizer devo usar?
Use MolGraphConvFeaturizer para GNNs, CircularFingerprint para ML tradicional, e RDKitDescriptors para modelos interpretáveis.
Como lidar com conjuntos de dados pequenos?
Aplique transfer learning com modelos pré-treinados ChemBERTa ou GROVER. Use aumento de dados e regularização mais forte.
Qual divisor devo usar?
Use ScaffoldSplitter para conjuntos de dados moleculares para garantir que compostos estruturalmente semelhantes permaneçam na mesma divisão.
Posso usar meu próprio conjunto de dados?
Sim, forneça um CSV com strings SMILES em uma coluna e valores alvo em outra. Use CSVLoader com nomes de colunas personalizados.
Quais modelos pré-treinados estão disponíveis?
ChemBERTa, GROVER e MolFormar são integrados. Carregue do HuggingFace para representações moleculares específicas do domínio.
Como melhorar o desempenho do modelo?
Experimente diferentes featurizers, aumente epochs de treinamento, use modelos maiores como AttentiveFP, ou aplique transfer learning de modelos pré-treinados.