Fähigkeiten arboreto
🧬

arboreto

Sicher ⚙️ Externe Befehle🌐 Netzwerkzugriff

Genregulatorische Netzwerke aus Expressionsdaten ableiten

Auch verfügbar von: davila7

Die Ableitung genregulatorischer Netzwerke identifiziert Transkriptionsfaktor-Zielgen-Beziehungen aus Transkriptomik-Daten. Arboreto bietet skalierbare Implementierungen der GRNBoost2- und GENIE3-Algorithmen, die sowohl Bulk- als auch Single-Cell-RNA-seq-Daten auf lokalen Maschinen oder verteilten Clustern verarbeiten.

Unterstützt: Claude Codex Code(CC)
🥈 78 Silber
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "arboreto". Infer a gene regulatory network from expression_data.tsv using arboreto

Erwartetes Ergebnis:

  • Netzwerk enthält 1500 regulatorische Links
  • Top-Regulatoren: TF1 (45 Ziele), TF2 (38 Ziele), TF3 (32 Ziele)
  • Höchste Wichtigkeit: TF1 -> gene5 (0,92 Wichtigkeitsscore)

Verwendung von "arboreto". Run GRNBoost2 with TF filtering on my single-cell data

Erwartetes Ergebnis:

  • Verarbeitet 8000 Zellen x 20000 Gene
  • Auf 250 bekannte Transkriptionsfaktoren gefiltert
  • Abgeleitetes Netzwerk in 4,2 Minuten auf lokalem Cluster
  • Top-Zelltypregulator: MYC (87 Ziele, durchschnittliche Wichtigkeit 0,78)

Sicherheitsaudit

Sicher
v4 • 1/17/2026

All 118 static findings are FALSE POSITIVES. The analyzer misidentified markdown Python code blocks (using triple backticks) as shell command execution, genetic algorithm names (GENIE3, GRNBoost2) as weak cryptographic algorithms, and Dask cluster configuration examples as C2/network reconnaissance. Arboreto is a legitimate open-source bioinformatics library for gene regulatory network inference from transcriptomics data. The only Python script (scripts/basic_grn_inference.py:1-97) is benign code that imports standard libraries and performs standard bioinformatics computations.

6
Gescannte Dateien
1,589
Analysierte Zeilen
2
befunde
4
Gesamtzahl Audits
Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

68
Architektur
100
Wartbarkeit
87
Inhalt
30
Community
100
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

Single-Cell-GRN-Analyse

Zellspezifische regulatorische Netzwerke aus scRNA-seq-Daten ableiten, um zelluläre Heterogenität zu verstehen.

Bulk-RNA-seq-Netzwerkableitung

Transkriptionsfaktor-Ziele in Bulk-Expressionsdatensätzen mit TF-Filterung für fokussierte Analyse identifizieren.

Verteilte Großskalige GRN

Datensätze mit Tausenden von Proben mit Dask-Clustern für Hochleistungsrechenumgebungen verarbeiten.

Probiere diese Prompts

Grundlegende GRN-Ableitung
Use arboreto to infer a gene regulatory network from my expression matrix in expression_data.tsv. Save results to network.tsv.
Mit TF-Filterung
Run grnboost2 on expression_data.tsv using only the transcription factors listed in tfs.txt. Set seed to 42 for reproducibility.
Cluster-Computing
Connect to my Dask cluster at tcp://scheduler:8786 and run grnboost2 on my large dataset with verbose output enabled.
Mehrere Bedingungen
Infer separate GRN networks for control, treatment_24h, and treatment_48h expression datasets using grnboost2. Save each with the corresponding condition name.

Bewährte Verfahren

  • Verwenden Sie immer den 'if __name__ == __main__:'-Guard in Skripten, da Dask neue Prozesse startet
  • Legen Sie einen Zufallssege fest für reproduzierbare Ergebnisse beim Vergleichen von Netzwerken
  • Filtern Sie die TF-Liste auf bekannte Transkriptionsfaktoren, um die Berechnungszeit zu reduzieren

Vermeiden

  • Das Ausführen von arboreto ohne TF-Filterung auf großen Datensätzen verursacht übermäßige Berechnungszeit
  • Das Vergessen des 'if __name__ == __main__:'-Guards verursacht Dask-Prozessstart-Fehler
  • Die Verwendung von GENIE3 auf Datensätzen mit Tausenden von Beobachtungen ist langsam; bevorzugen Sie GRNBoost2 für große Daten

Häufig gestellte Fragen

Was ist der Unterschied zwischen GRNBoost2 und GENIE3?
GRNBoost2 verwendet Gradient Boosting und ist schneller für große Datensätze. GENIE3 verwendet Random Forest und ist besser für kleine Datensätze oder Validierung.
Welches Eingabeformat erwartet arboreto?
Genexpressionsmatrix mit Genen als Spalten und Beobachtungen als Zeilen. Verwenden Sie Pandas DataFrame oder NumPy-Array mit Gennamen.
Wie funktioniert verteiltes Computing?
Arboreto verwendet Dask, um die Gen-weise Regression zu parallelisieren. Stellen Sie eine Verbindung zu einem LocalCluster oder Remote-Scheduler für die Berechnung über mehrere Knoten her.
Was bedeutet die Ausgabe?
Die Ausgabe sind TF-Ziel-Wichtigkeits-Tripletts, wobei höhere Wichtigkeitswerte auf stärkere vorhergesagte regulatorische Beziehungen hinweisen.
Wie filtere ich die Ergebnisse?
Filtern Sie nach Wichtigkeitsschwellenwert (z.B. > 0,5) oder wählen Sie Top N Links pro Zielgen aus. Verwenden Sie pandas DataFrame-Operationen.
Kann ich dies mit pySCENIC verwenden?
Ja, arboreto bietet GRN-Ableitung als ersten Schritt des SCENIC-Pipelines für Single-Cell-regulatorische Netzwerkanalyse.