🧪

deepchem

Name: deepchem
Author: K-Dense-AI

Sicher ⚡ Enthält Skripte📁 Dateisystemzugriff🌐 Netzwerkzugriff

Maschinelles Lernen für Chemie und Arzneimittelforschung anwenden

Auch verfügbar von: davila7

Molekulare Eigenschaften wie Löslichkeit, Toxizität und Bindungsaffinität mit DeepChem vorhersagen. Graphische neuronale Netze trainieren oder vortrainierte Modelle wie ChemBERTa für Arzneimittelforschung und Materialwissenschaften nutzen.

Unterstützt: Claude Codex Code(CC)

🥉 75 Bronze

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "deepchem". Löslichkeit für diese Moleküle vorhersagen: 'CCO', 'CC(=O)O', 'c1ccccc1'

Erwartetes Ergebnis:

Löslichkeitsvorhersagen (log mol/L):
• Ethanol (CCO): -0.92
• Essigsäure (CC(=O)O): -0.45
• Benzol (c1ccccc1): -1.69
Hinweis: Niedrigere Werte zeigen eine geringere Wasserlöslichkeit an.

Sicherheitsaudit

Sicher

v4 • 1/17/2026

This is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.

Gescannte Dateien

2,764

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚡ Enthält Skripte (3)

scripts/graph_neural_network.py:1-339 scripts/predict_solubility.py:1-225 scripts/transfer_learning.py:1-376

📁 Dateisystemzugriff (3)

scripts/graph_neural_network.py:55-65 scripts/predict_solubility.py:45-55 scripts/transfer_learning.py:50-60

🌐 Netzwerkzugriff (1)

SKILL.md:245-255

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Verbindungsbibliotheken durchsuchen

Löslichkeit und Toxizität für große Verbindungsbibliotheken vorhersagen, um Kandidaten für die Synthese zu priorisieren.

Molekulare Eigenschaftsmodelle erstellen

Kundenspezifische Modelle auf proprietären Datensätzen mit graphischen neuronalen Netzwerken oder traditionellen ML-Algorithmen trainieren.

Transferlernen anwenden

Vortrainierte Chemiemodelle wie ChemBERTa auf kleinen Datensätzen mit wenigen markierten Beispielen feinabstimmen.

Probiere diese Prompts

Molekulardaten laden

DeepChem verwenden, um eine CSV-Datei mit SMILES-Strings unter 'molecules.csv' zu laden und die Löslichkeit mit CircularFingerprint-Featurizer und einem trainierten Modell vorherzusagen.

GNN-Modell trainieren

Ein Graph Convolutional Network auf dem Tox21-Datensatz mit DeepChem trainieren, um Toxizität über alle 12 Aufgaben vorherzusagen.

Transferlernen

Das vortrainierte ChemBERTa-Modell von HuggingFace verwenden und es auf meinem benutzerdefinierten Datensatz unter 'activity.csv' feinabstimmen, um die Bindungsaffinität vorherzusagen.

Stapelvorhersagen

Ein trainiertes DeepChem-Modell laden und Vorhersagen für eine Liste neuer SMILES-Strings treffen: 'CCO', 'CC(=O)O', 'c1ccccc1'. Konfidenzwerte zurückgeben.

Bewährte Verfahren

ScaffoldSplitter anstelle einer zufälligen Aufteilung für molekulare Datensätze verwenden, um Datenleckage durch ähnliche Moleküle zu verhindern
Transferlernen mit vortrainierten Modellen anwenden, wenn die Datensatzgröße weniger als 10.000 Proben beträgt
Dropout erhöhen (0,3-0,5) und einfachere Modelle für kleine Datensätze verwenden, um Überanpassung zu verhindern

Vermeiden

Zufällige Zug-/Test-Aufteilungen auf molekulare Daten verwenden - führt zu Datenleckage aus ähnlichen Strukturen
Tiefe GNNs auf Datensätzen mit weniger als 1.000 Proben trainieren - hohes Überanpassungsrisiko
Klassenungleichgewicht in Toxizitätsdatensätzen ignorieren - Aufgabenverteilung vor dem Training immer überprüfen

Häufig gestellte Fragen

Welchen Featurizer sollte ich verwenden?

MolGraphConvFeaturizer für GNNs, CircularFingerprint für traditionelles ML und RDKitDescriptors für interpretierbare Modelle verwenden.

Wie gehe ich mit kleinen Datensätzen um?

Transferlernen mit vortrainierten ChemBERTa- oder GROVER-Modellen anwenden. Datenaugmentation und stärkere Regularisierung verwenden.

Welchen Splitter sollte ich verwenden?

ScaffoldSplitter für molekulare Datensätze verwenden, um sicherzustellen, dass strukturell ähnliche Verbindungen in derselben Aufteilung bleiben.

Kann ich meinen eigenen Datensatz verwenden?

Ja, eine CSV mit SMILES-Strings in einer Spalte und Zielwerten in einer anderen bereitstellen. CSVLoader mit benutzerdefinierten Spaltennamen verwenden.

Welche vortrainierten Modelle sind verfügbar?

ChemBERTa, GROVER und MolFormer sind integriert. Von HuggingFace für domänenspezifische molekulare Darstellungen laden.

Wie verbessere ich die Modellleistung?

Verschiedene Featurizer ausprobieren, Trainingsepochen erhöhen, größere Modelle wie AttentiveFP verwenden oder Transferlernen von vortrainierten Modellen anwenden.