🧪

molfeat

Name: molfeat
Author: K-Dense-AI

Sicher ⚙️ Externe Befehle📁 Dateisystemzugriff🌐 Netzwerkzugriff

Moleküle in ML-Features umwandeln

Auch verfügbar von: davila7

Molekulares maschinelles Lernen erfordert die Umwandlung chemischer Strukturen in numerische Darstellungen. Molfeat bietet über 100 Featurisierer, um SMILES-Strings in maschinell lernbereite Features für QSAR-Modellierung und Wirkstoffforschung umzuwandeln.

Unterstützt: Claude Codex Code(CC)

📊 70 Angemessen

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "molfeat". Convert aspirin (CC(=O)OC1=CC=CC=C1C(=O)O) to ECFP fingerprint

Erwartetes Ergebnis:

Generierter ECFP-Fingerprint mit Radius 3 und 2048 Bits
Nicht-Null-Bits: 45 Features aktiviert
Bit-Dichte: 2,2% (dünnbesetzte Darstellung)
Form: (2048,) numpy-Array
Bereit für maschinelle Lernmodelle

Verwendung von "molfeat". Compare ECFP, MACCS, and RDKit descriptors for caffeine

Erwartetes Ergebnis:

ECFP4: 2048-Bit-Vektor mit 52 nicht-Null-Features
MACCS: 167-Bit-strukturelle Schlüssel mit 28 wahren Bits
RDKit2D: 200+ Deskriptorwerte einschließlich LogP=0,43, TPSA=61,1
Kombinierte Features: 2415-dimensionaler Vektor

Sicherheitsaudit

Sicher

v4 • 1/17/2026

The molfeat skill is a legitimate cheminformatics library for molecular feature extraction. All 397 static findings are false positives triggered by scientific terminology in documentation. The scanner misinterpreted markdown code fences as shell commands, chemistry terminology (ecfp, maccs, gin, c2) as security threats, and documentation URLs as network indicators.

Gescannte Dateien

2,234

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (1)

SKILL.md:28-497

📁 Dateisystemzugriff (1)

SKILL.md:399-400

🌐 Netzwerkzugriff (1)

SKILL.md:505-508

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

QSAR-Modelle für Wirkstoffeigenschaften erstellen

Molekulare Fingerabdrücke und Deskriptoren verwenden, um maschinelle Lernmodelle zu trainieren, die ADME-Eigenschaften, Toxizität oder Bioaktivität vorhersagen

Virtuelles Screening von Verbindungsbibliotheken

Millionen von Molekülen in Features für Ähnlichkeitssuche und Aktivitätsvorhersage gegen biologische Ziele umwandeln

Analyse und Clustering des chemischen Raums

Molekulare Einbettungen generieren, um chemische Bibliotheken für Diversitätsanalyse zu visualisieren und zu clustern

Probiere diese Prompts

Grundlegende Fingerprint-Generierung

Verwenden Sie molfeat, um diese SMILES in ECFP-Fingerprints umzuwandeln: CCO, CC(=O)O, c1ccccc1. Zeigen Sie den Code und die Ausgabeform.

Batch-Verarbeitung von Deskriptoren

Laden Sie einen Datensatz von 100 Molekülen und extrahieren Sie RDKit 2D-Deskriptoren mit molfeat und paralleler Verarbeitung.

Eingebettete Daten vortrainierter Modelle

Verwenden Sie ChemBERTa, um Einbettungen für wirkstoffähnliche Moleküle zu generieren und visualisieren Sie sie mit PCA.

Optimierung der QSAR-Pipeline

Vergleichen Sie ECFP, MACCS und ChemBERTa-Features für die Vorhersage molekularer Eigenschaften mit Random-Forest-Regression.

Bewährte Verfahren

Verwenden Sie n_jobs=-1 für parallele Verarbeitung auf Mehrkernsystemen
Zwischenspeichern Sie Eingebettungen vortrainierter Modelle, um Neuberechnungen zu vermeiden
Behandeln Sie ungültige Moleküle mit ignore_errors=True für große Datensätze

Vermeiden

Ein Molekül gleichzeitig in Schleifen verarbeiten anstatt Batch-Verarbeitung zu verwenden
Deep-Learning-Modelle für einfache Ähnlichkeitssuchen verwenden, wo Fingerprints ausreichen
Fehlerbehandlung ignorieren, wenn große Verbindungsbibliotheken verarbeitet werden

Häufig gestellte Fragen

Was ist der Unterschied zwischen Kalkulatoren und Transformern?

Kalkulatoren verarbeiten einzelne Moleküle, während Transformer Batches mit Parallelisierung und scikit-learn-Kompatibilität verarbeiten.

Welchen Featurisierer sollte ich für die QSAR-Modellierung verwenden?

Beginnen Sie mit ECFP-Fingerprints (Radius 2-3, 1024-2048 Bits), da sie molekulare Konnektivitätsmuster erfassen, die für Bioaktivität relevant sind.

Wie gehe ich mit ungültigen SMILES-Strings um?

Setzen Sie ignore_errors=True in MoleculeTransformer, um ungültige Moleküle zu überspringen und die Verarbeitung fortzusetzen.

Kann ich mehrere Featurisierer kombinieren?

Ja, verwenden Sie FeatConcat, um verschiedene Feature-Typen wie Fingerprints und Deskriptoren zu einem einzigen Vektor zu kombinieren.

Warum sind vortrainierte Modelle langsamer als Fingerprints?

Deep-Learning-Modelle erfordern neuronale Netzwerk-Inferenz, während Fingerprints vordefinierte Algorithmen verwenden, aber bessere Transfer-Learning-Fähigkeiten bieten.

Wie speichere und wiederverwende ich Featurisierer-Konfigurationen?

Verwenden Sie transformer.to_state_yaml_file() zum Speichern und MoleculeTransformer.from_state_yaml_file() zum Neuladen von Konfigurationen.

Entwicklerdetails

Autor

K-Dense-AI

Lizenz

Apache-2.0 license

Repository

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/molfeat

Ref

main

Dateistruktur

📁 references/

📄 api_reference.md

📄 available_featurizers.md

📄 examples.md

📄 SKILL.md