deepchem
Maschinelles Lernen für Chemie und Arzneimittelforschung anwenden
Auch verfügbar von: davila7
Molekulare Eigenschaften wie Löslichkeit, Toxizität und Bindungsaffinität mit DeepChem vorhersagen. Graphische neuronale Netze trainieren oder vortrainierte Modelle wie ChemBERTa für Arzneimittelforschung und Materialwissenschaften nutzen.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "deepchem". Löslichkeit für diese Moleküle vorhersagen: 'CCO', 'CC(=O)O', 'c1ccccc1'
Erwartetes Ergebnis:
- Löslichkeitsvorhersagen (log mol/L):
- • Ethanol (CCO): -0.92
- • Essigsäure (CC(=O)O): -0.45
- • Benzol (c1ccccc1): -1.69
- Hinweis: Niedrigere Werte zeigen eine geringere Wasserlöslichkeit an.
Sicherheitsaudit
SicherThis is a legitimate scientific computing skill for DeepChem molecular machine learning. All 237 static findings are false positives. The findings originate from markdown documentation code examples being incorrectly flagged as executable Ruby/shell commands. Common English words in chemistry documentation are matching C2 security patterns. The Python scripts use argparse for safe argument handling with no hardcoded secrets or dangerous operations.
Risikofaktoren
⚡ Enthält Skripte (3)
📁 Dateisystemzugriff (3)
🌐 Netzwerkzugriff (1)
Qualitätsbewertung
Was du bauen kannst
Verbindungsbibliotheken durchsuchen
Löslichkeit und Toxizität für große Verbindungsbibliotheken vorhersagen, um Kandidaten für die Synthese zu priorisieren.
Molekulare Eigenschaftsmodelle erstellen
Kundenspezifische Modelle auf proprietären Datensätzen mit graphischen neuronalen Netzwerken oder traditionellen ML-Algorithmen trainieren.
Transferlernen anwenden
Vortrainierte Chemiemodelle wie ChemBERTa auf kleinen Datensätzen mit wenigen markierten Beispielen feinabstimmen.
Probiere diese Prompts
DeepChem verwenden, um eine CSV-Datei mit SMILES-Strings unter 'molecules.csv' zu laden und die Löslichkeit mit CircularFingerprint-Featurizer und einem trainierten Modell vorherzusagen.
Ein Graph Convolutional Network auf dem Tox21-Datensatz mit DeepChem trainieren, um Toxizität über alle 12 Aufgaben vorherzusagen.
Das vortrainierte ChemBERTa-Modell von HuggingFace verwenden und es auf meinem benutzerdefinierten Datensatz unter 'activity.csv' feinabstimmen, um die Bindungsaffinität vorherzusagen.
Ein trainiertes DeepChem-Modell laden und Vorhersagen für eine Liste neuer SMILES-Strings treffen: 'CCO', 'CC(=O)O', 'c1ccccc1'. Konfidenzwerte zurückgeben.
Bewährte Verfahren
- ScaffoldSplitter anstelle einer zufälligen Aufteilung für molekulare Datensätze verwenden, um Datenleckage durch ähnliche Moleküle zu verhindern
- Transferlernen mit vortrainierten Modellen anwenden, wenn die Datensatzgröße weniger als 10.000 Proben beträgt
- Dropout erhöhen (0,3-0,5) und einfachere Modelle für kleine Datensätze verwenden, um Überanpassung zu verhindern
Vermeiden
- Zufällige Zug-/Test-Aufteilungen auf molekulare Daten verwenden - führt zu Datenleckage aus ähnlichen Strukturen
- Tiefe GNNs auf Datensätzen mit weniger als 1.000 Proben trainieren - hohes Überanpassungsrisiko
- Klassenungleichgewicht in Toxizitätsdatensätzen ignorieren - Aufgabenverteilung vor dem Training immer überprüfen
Häufig gestellte Fragen
Welchen Featurizer sollte ich verwenden?
Wie gehe ich mit kleinen Datensätzen um?
Welchen Splitter sollte ich verwenden?
Kann ich meinen eigenen Datensatz verwenden?
Welche vortrainierten Modelle sind verfügbar?
Wie verbessere ich die Modellleistung?
Entwicklerdetails
Autor
K-Dense-AILizenz
MIT license
Repository
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/deepchemRef
main
Dateistruktur