🧬

geniml

Sicher ⚙️ Externe Befehle🌐 Netzwerkzugriff⚡ Enthält Skripte📁 Dateisystemzugriff

Genomische Regionen mit ML analysieren

Auch verfügbar von: K-Dense-AI

Die Arbeit mit genomischen Intervalldaten für maschinelles Lernen erfordert spezialisierte Werkzeuge. Geniml bietet überwachte Methoden zum Lernen von Einbettungen genomischer Regionen, einzelner Zellen und Metadaten-Labels für Ähnlichkeitssuche, Clustering und nachgelagerte Analysen.

Unterstützt: Claude Codex Code(CC)
📊 71 Angemessen
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "geniml". Hilf mir, mit geniml für die Analyse meiner ATAC-seq Peaks zu beginnen

Erwartetes Ergebnis:

  • Geniml installieren: uv pip install geniml
  • Für ML-Funktionen: uv pip install 'geniml[ml]'
  • Grundlegender Workflow: 1) Universum aus Peaks erstellen, 2) BED-Dateien tokenisieren, 3) Region2Vec trainieren, 4) Einbettungen evaluieren
  • Wichtige Parameter: embedding_dim (50-300), num_shufflings (500-2000), p_value_threshold (1e-9)
  • Ausgabe: Regionseinbettungen für Ähnlichkeitssuche, Clustering und nachgelagertes ML

Verwendung von "geniml". Wie verwende ich BEDspace für metadatengestützte Suchen

Erwartetes Ergebnis:

  • Vorverarbeiten: geniml bedspace preprocess --input regions/ --metadata labels.csv --universe universe.bed
  • Trainieren: geniml bedspace train --input preprocessed.txt --output model/ --dim 100
  • Suchtypen: r2l (Region zu Label), l2r (Label zu Region), r2r (Region zu Region)
  • Abfrage-Beispiel: geniml bedspace search -t r2l -d distances.pkl -q query.bed -n 10

Sicherheitsaudit

Sicher
v5 • 1/17/2026

Documentation-only skill containing markdown files for the geniml genomic ML package. All 190 static findings are false positives triggered by CLI examples and URLs in documentation. No executable code exists. All detected patterns are legitimate documentation of genomic analysis tools and methods.

7
Gescannte Dateien
1,567
Analysierte Zeilen
4
befunde
5
Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (145)
references/bedspace.md:23-30 references/bedspace.md:30-34 references/bedspace.md:34-38 references/bedspace.md:38-44 references/bedspace.md:44-52 references/bedspace.md:52-55 references/bedspace.md:55-56 references/bedspace.md:56-57 references/bedspace.md:57-63 references/bedspace.md:63-69 references/bedspace.md:69-78 references/bedspace.md:78-80 references/bedspace.md:80-83 references/bedspace.md:83-85 references/bedspace.md:85-88 references/bedspace.md:88-90 references/bedspace.md:90-92 references/bedspace.md:92-96 references/bedspace.md:96-108 references/bedspace.md:108-112 references/consensus_peaks.md:21-23 references/consensus_peaks.md:23-29 references/consensus_peaks.md:29-31 references/consensus_peaks.md:31-34 references/consensus_peaks.md:34-35 references/consensus_peaks.md:35-36 references/consensus_peaks.md:36-50 references/consensus_peaks.md:50-57 references/consensus_peaks.md:57-60 references/consensus_peaks.md:60-61 references/consensus_peaks.md:61-62 references/consensus_peaks.md:62-70 references/consensus_peaks.md:70-78 references/consensus_peaks.md:78-81 references/consensus_peaks.md:81-89 references/consensus_peaks.md:89-96 references/consensus_peaks.md:96-99 references/consensus_peaks.md:99-107 references/consensus_peaks.md:107-114 references/consensus_peaks.md:114-117 references/consensus_peaks.md:117-123 references/consensus_peaks.md:123-135 references/consensus_peaks.md:135-158 references/consensus_peaks.md:158-159 references/consensus_peaks.md:159-160 references/consensus_peaks.md:160-176 references/consensus_peaks.md:176-188 references/consensus_peaks.md:188-199 references/consensus_peaks.md:199-203 references/region2vec.md:25-33 references/region2vec.md:33-41 references/region2vec.md:41-53 references/region2vec.md:53-59 references/region2vec.md:59-60 references/region2vec.md:60-61 references/region2vec.md:61-62 references/region2vec.md:62-63 references/region2vec.md:63-67 references/region2vec.md:67-75 references/region2vec.md:75-79 references/region2vec.md:79 references/region2vec.md:79 references/region2vec.md:79 references/scembed.md:19 references/scembed.md:19 references/scembed.md:19 references/scembed.md:19 references/scembed.md:23-38 references/scembed.md:38-44 references/scembed.md:44-52 references/scembed.md:52-63 references/scembed.md:63-86 references/scembed.md:86-92 references/scembed.md:92-103 references/scembed.md:103-109 references/scembed.md:109-123 references/scembed.md:123-131 references/scembed.md:131-132 references/scembed.md:132-133 references/scembed.md:133-134 references/scembed.md:134-135 references/scembed.md:135-136 references/scembed.md:136-147 references/scembed.md:147-155 references/scembed.md:155-161 references/scembed.md:161-177 references/scembed.md:177-189 references/scembed.md:189-194 references/utilities.md:19-30 references/utilities.md:30-34 references/utilities.md:34-43 references/utilities.md:43-69 references/utilities.md:69-79 references/utilities.md:79-83 references/utilities.md:83-90 references/utilities.md:90-95 references/utilities.md:95-97 references/utilities.md:97-101 references/utilities.md:101-103 references/utilities.md:103-107 references/utilities.md:107-109 references/utilities.md:109-137 references/utilities.md:137-149 references/utilities.md:149-161 references/utilities.md:161-173 references/utilities.md:173-201 references/utilities.md:201-210 references/utilities.md:210-213 references/utilities.md:213-219 references/utilities.md:219-228 references/utilities.md:228-231 references/utilities.md:231-237 references/utilities.md:237-247 references/utilities.md:247-260 references/utilities.md:260-270 references/utilities.md:270-298 references/utilities.md:298-306 references/utilities.md:306-310 references/utilities.md:310-326 references/utilities.md:326-341 references/utilities.md:341-352 references/utilities.md:352-356 references/utilities.md:356-364 references/utilities.md:364-369 references/utilities.md:369-383 SKILL.md:16-18 SKILL.md:18-22 SKILL.md:22-24 SKILL.md:24-28 SKILL.md:28-30 SKILL.md:30-47 SKILL.md:47-61 SKILL.md:61-76 SKILL.md:76-95 SKILL.md:95-108 SKILL.md:108-114 SKILL.md:114-140 SKILL.md:140-144 SKILL.md:144-171 SKILL.md:171-175 SKILL.md:175-193 SKILL.md:193-199 SKILL.md:199-217 SKILL.md:217-270 SKILL.md:270-310
🌐 Netzwerkzugriff (6)
⚡ Enthält Skripte (1)
📁 Dateisystemzugriff (4)
Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

45
Architektur
100
Wartbarkeit
87
Inhalt
21
Community
100
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

Genregulationsmuster analysieren

Einbettungen auf ChIP-seq oder ATAC-seq Peaks trainieren, um regulatorische Regionen zu identifizieren und experimentelle Bedingungen zu vergleichen.

Einzelzell-Chromatin-Daten annotieren

Zell-Einbettungen aus scATAC-seq-Daten für Clustering, Zelltyp-Annotation und Integration mit scanpy-Workflows generieren.

Genomische Referenzdatenbanken erstellen

Konsensus-Peak-Universen und durchsuchbare genomische Datenbanken mit metadatengestützten Ähnlichkeitsabfragen erstellen.

Probiere diese Prompts

Grundlegende Regionseinbettung
Hilf mir, geniml Region2Vec zu verwenden, um Einbettungen auf meiner BED-Dateisammlung zu trainieren. Ich habe Peaks in /path/to/bed/files und muss zuerst ein Universum erstellen.
Einzelzell-Analyse
Führe mich durch das scEmbed-Training für meinen Einzelzell-ATAC-seq-Datensatz. Ich habe ein AnnData-Objekt mit Peak-Koordinaten und möchte Zellen nach Chromatin-Zugänglichkeit clustern.
Metadaten-Abfragen
Zeig mir, wie ich geniml BEDspace verwende, um eine durchsuchbare Datenbank zu erstellen, in der ich Regionen nach Metadaten-Labels wie Zelltyp oder Gewebe abfragen kann.
Fortgeschrittener Workflow
Entwickle einen vollständigen geniml-Workflow, der Universum-Erstellung, Region2Vec-Training, Einbettungsevaluation und UMAP-Visualisierung für vergleichende genomische Analysen kombiniert.

Bewährte Verfahren

  • Zeit in die Erstellung einer umfassenden Universum-Datei für zuverlässige Tokenisierung investieren
  • Tokenisierungsabdeckung validieren (Ziel: >80%) vor dem Training der Einbettungen
  • Mehrere Evaluationsmetriken (Silhouette, Davies-Bouldin) verwenden, um Einbettungsqualität zu bewerten
  • Parameter und Zufalls-SEEDS für Reproduzierbarkeit dokumentieren

Vermeiden

  • Universum-Validierung überspringen - schlechte Universen führen zu unzuverlässigen Einbettungen
  • Zu wenige Trainingsepochen oder falsche Lernraten verwenden
  • Daten verarbeiten, ohne zuerst die Eingabequalität zu prüfen
  • Vergessen, Peak-Koordinaten auf die Genom-Assembly zu validieren

Häufig gestellte Fragen

Was ist geniml?
Geniml ist ein Python-Paket für maschinelles Lernen auf genomischen Intervalldaten. Es trainiert Einbettungen aus BED-Dateien für Ähnlichkeitsanalyse, Clustering und nachgelagerte Vorhersagen.
Welche Genome werden unterstützt?
Geniml funktioniert mit jedem Genom mit einer gültigen Chromosomgrößen-Datei. Gängige Assemblies (hg38, mm10) werden vollständig durch externe Werkzeuge wie Gtars unterstützt.
Kann ich geniml mit scanpy verwenden?
Ja. scEmbed-Einbettungen integrieren sich nahtlos in scanpy-Workflows. Einbettungen zu adata.obsm['scembed_X'] hinzufügen und Standard-scanpy-Clustering- und Visualisierungsfunktionen verwenden.
Sind meine Daten bei geniml sicher?
Geniml verarbeitet Daten lokal. Es werden keine Daten an externe Server gesendet. Alle Operationen werden auf Ihrer Maschine unter Verwendung Ihrer angegebenen Eingabedateien ausgeführt.
Warum konvergieren meine Einbettungen nicht?
Lernrate prüfen (0,01-0,05 versuchen), Epochen erhöhen und Datenqualität sicherstellen. Stellen Sie sicher, dass Ihre Universum-Datei Ihre Regionen abdeckt und die Tokenisierungsabdeckung ausreichend ist.
Wie unterscheidet sich geniml von anderen Werkzeugen?
Geniml spezialisiert sich auf genomische Intervall-Einbettungen. Im Gegensatz zu allgemeinen ML-Werkzeugen enthält es genomische spezifische Tokenisierung, Konsensus-Peak-Erstellung und biologische Evaluationsmetriken.