🧬

arboreto

Name: arboreto
Author: K-Dense-AI

Sicher ⚙️ Externe Befehle🌐 Netzwerkzugriff

Genregulatorische Netzwerke aus Expressionsdaten ableiten

Auch verfügbar von: davila7

Die Ableitung genregulatorischer Netzwerke identifiziert Transkriptionsfaktor-Zielgen-Beziehungen aus Transkriptomik-Daten. Arboreto bietet skalierbare Implementierungen der GRNBoost2- und GENIE3-Algorithmen, die sowohl Bulk- als auch Single-Cell-RNA-seq-Daten auf lokalen Maschinen oder verteilten Clustern verarbeiten.

Unterstützt: Claude Codex Code(CC)

🥈 77 Silber

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "arboreto". Infer a gene regulatory network from expression_data.tsv using arboreto

Erwartetes Ergebnis:

Netzwerk enthält 1500 regulatorische Links
Top-Regulatoren: TF1 (45 Ziele), TF2 (38 Ziele), TF3 (32 Ziele)
Höchste Wichtigkeit: TF1 -> gene5 (0,92 Wichtigkeitsscore)

Verwendung von "arboreto". Run GRNBoost2 with TF filtering on my single-cell data

Erwartetes Ergebnis:

Verarbeitet 8000 Zellen x 20000 Gene
Auf 250 bekannte Transkriptionsfaktoren gefiltert
Abgeleitetes Netzwerk in 4,2 Minuten auf lokalem Cluster
Top-Zelltypregulator: MYC (87 Ziele, durchschnittliche Wichtigkeit 0,78)

Sicherheitsaudit

Sicher

v4 • 1/17/2026

All 118 static findings are FALSE POSITIVES. The analyzer misidentified markdown Python code blocks (using triple backticks) as shell command execution, genetic algorithm names (GENIE3, GRNBoost2) as weak cryptographic algorithms, and Dask cluster configuration examples as C2/network reconnaissance. Arboreto is a legitimate open-source bioinformatics library for gene regulatory network inference from transcriptomics data. The only Python script (scripts/basic_grn_inference.py:1-97) is benign code that imports standard libraries and performs standard bioinformatics computations.

Gescannte Dateien

1,589

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (2)

references/algorithms.md:29-37 SKILL.md:20-22

🌐 Netzwerkzugriff (2)

references/distributed_computing.md:109 references/distributed_computing.md:124

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Single-Cell-GRN-Analyse

Zellspezifische regulatorische Netzwerke aus scRNA-seq-Daten ableiten, um zelluläre Heterogenität zu verstehen.

Bulk-RNA-seq-Netzwerkableitung

Transkriptionsfaktor-Ziele in Bulk-Expressionsdatensätzen mit TF-Filterung für fokussierte Analyse identifizieren.

Verteilte Großskalige GRN

Datensätze mit Tausenden von Proben mit Dask-Clustern für Hochleistungsrechenumgebungen verarbeiten.

Probiere diese Prompts

Grundlegende GRN-Ableitung

Use arboreto to infer a gene regulatory network from my expression matrix in expression_data.tsv. Save results to network.tsv.

Mit TF-Filterung

Run grnboost2 on expression_data.tsv using only the transcription factors listed in tfs.txt. Set seed to 42 for reproducibility.

Cluster-Computing

Connect to my Dask cluster at tcp://scheduler:8786 and run grnboost2 on my large dataset with verbose output enabled.

Mehrere Bedingungen

Infer separate GRN networks for control, treatment_24h, and treatment_48h expression datasets using grnboost2. Save each with the corresponding condition name.

Bewährte Verfahren

Verwenden Sie immer den 'if __name__ == __main__:'-Guard in Skripten, da Dask neue Prozesse startet
Legen Sie einen Zufallssege fest für reproduzierbare Ergebnisse beim Vergleichen von Netzwerken
Filtern Sie die TF-Liste auf bekannte Transkriptionsfaktoren, um die Berechnungszeit zu reduzieren

Vermeiden

Das Ausführen von arboreto ohne TF-Filterung auf großen Datensätzen verursacht übermäßige Berechnungszeit
Das Vergessen des 'if __name__ == __main__:'-Guards verursacht Dask-Prozessstart-Fehler
Die Verwendung von GENIE3 auf Datensätzen mit Tausenden von Beobachtungen ist langsam; bevorzugen Sie GRNBoost2 für große Daten

Häufig gestellte Fragen

Was ist der Unterschied zwischen GRNBoost2 und GENIE3?

GRNBoost2 verwendet Gradient Boosting und ist schneller für große Datensätze. GENIE3 verwendet Random Forest und ist besser für kleine Datensätze oder Validierung.

Welches Eingabeformat erwartet arboreto?

Genexpressionsmatrix mit Genen als Spalten und Beobachtungen als Zeilen. Verwenden Sie Pandas DataFrame oder NumPy-Array mit Gennamen.

Wie funktioniert verteiltes Computing?

Arboreto verwendet Dask, um die Gen-weise Regression zu parallelisieren. Stellen Sie eine Verbindung zu einem LocalCluster oder Remote-Scheduler für die Berechnung über mehrere Knoten her.

Was bedeutet die Ausgabe?

Die Ausgabe sind TF-Ziel-Wichtigkeits-Tripletts, wobei höhere Wichtigkeitswerte auf stärkere vorhergesagte regulatorische Beziehungen hinweisen.

Wie filtere ich die Ergebnisse?

Filtern Sie nach Wichtigkeitsschwellenwert (z.B. > 0,5) oder wählen Sie Top N Links pro Zielgen aus. Verwenden Sie pandas DataFrame-Operationen.

Kann ich dies mit pySCENIC verwenden?

Ja, arboreto bietet GRN-Ableitung als ersten Schritt des SCENIC-Pipelines für Single-Cell-regulatorische Netzwerkanalyse.