Fähigkeiten scvi-tools
📦

scvi-tools

Niedriges Risiko 🌐 Netzwerkzugriff📁 Dateisystemzugriff

Single-Cell-Genomik-Daten analysieren

Auch verfügbar von: davila7

Single-Cell-Genomik-Analysen erfordern probabilistische Modelle, um technisches Rauschen und Batch-Effekte zu bewältigen. scvi-tools bietet tiefe generativ Modelle mit variativer Inferenz für Dimensionsreduktion, Batch-Korrektur, differentielle Expression und multimodale Integration von Single-Cell-Daten.

Unterstützt: Claude Codex Code(CC)
📊 69 Angemessen
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "scvi-tools". Hilf mir, scVI für Batch-Korrektur auf meinem Single-Cell-Datensatz mit zwei Batches einzurichten.

Erwartetes Ergebnis:

```python
import scvi
import scanpy as sc

# Preprocess data
adata = sc.read_h5ad("my_single_cell_data.h5ad")
sc.pp.filter_genes(adata, min_counts=3)

# Register data with batch information
scvi.model.SCVI.setup_anndata(
adata,
layer="counts",
batch_key="batch"
)

# Train model
model = scvi.model.SCVI(adata)
model.train()

# Get batch-corrected latent representation
latent = model.get_latent_representation()
adata.obsm["X_scVI"] = latent

# Downstream analysis
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)
```

Verwendung von "scvi-tools". Wie identifiziere ich Markergene zwischen zwei Zelltypen in meinem scVI-Modell?

Erwartetes Ergebnis:

```python
# Differential expression between two groups
de_results = model.differential_expression(
groupby="leiden",
group1="0", # Cluster 0
group2="1", # Cluster 1
mode="change",
delta=0.25 # Minimum effect size
)

# View top differentially expressed genes
print(de_results.head(20))

# Filter for significant genes
significant_genes = de_results[
(de_results['is_de_fdr_0.05']) &
(de_results['bayes_factor'] > 1)
]
print(f"Found {len(significant_genes)} differentially expressed genes")
```

Sicherheitsaudit

Niedriges Risiko
v5 • 1/21/2026

This is a documentation-only skill containing markdown reference files for scvi-tools, a legitimate Python library for single-cell genomics analysis. All 399 static findings are false positives caused by incorrect pattern matching: Python code examples in documentation were flagged as shell commands, bioinformatics statistical terms were misidentified as cryptographic algorithms, and documentation URLs were flagged as hardcoded URLs. No executable code or malicious patterns exist. Safe for publication.

11
Gescannte Dateien
7,698
Analysierte Zeilen
2
befunde
5
Gesamtzahl Audits

Risikofaktoren

🌐 Netzwerkzugriff (1)
📁 Dateisystemzugriff
Keine spezifischen Standorte aufgezeichnet
Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

45
Architektur
100
Wartbarkeit
87
Inhalt
20
Community
90
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

Batch-Korrektur für integrierte Single-Cell-Analyse

Entfernen technischer Batch-Effekte aus Single-Cell-RNA-seq-Datensätzen über mehrere Spender, Protokolle oder Sequenzierungsläufe hinweg mit scVI zur Erstellung einheitlicher, integrierter Zell-Atlanten.

Differentielle Expression mit Unsicherheit

Identifizieren differentiell exprimierter Gene zwischen Zelltypen oder Bedingungen mit probabilistischen Unsicherheitsschätzungen, die zuverlässigere statistische Schlussfolgerungen für nachgelagerte Validierungen liefern.

Multimodale Datenintegration

Gemeinsame Analyse gepaarter RNA- und Proteinmessungen (CITE-seq) oder Chromatin-Zugänglichkeitsdaten zur Entdeckung von Zellpopulationen mit erhöhter biologischer Auflösung.

Probiere diese Prompts

Grundlegende scVI-Modell-Einrichtung
Hilf mir, scvi-tools einzurichten, um meine Single-Cell-RNA-seq-Daten zu analysieren. Ich habe ein AnnData-Objekt mit Rohdaten und möchte eine Batch-Korrektur durchführen. Zeige mir, wie ich die Daten registriere, das Modell trainiere und latente Repräsentationen extrahiere.
Differentielle Expressionsanalyse
Ich habe ein scVI-Modell auf meinem Single-Cell-Datensatz mit Zelltyp-Annotationen trainiert. Hilf mir, differentiell exprimierte Gene zwischen zwei Zelltypen zu identifizieren (z.B. Cluster A vs. Cluster B) mit der differential_expression-Methode. Inklusive wie ich die Ergebnisse interpretiere und Effektgrößen-Schwellenwerte setze.
Multimodale Integration mit totalVI
Ich habe gepaarte CITE-seq-Daten mit RNA-Zählwerten und Protein-Antikörper-abgeleiteten Zählwerten. Hilf mir, totalVI einzurichten, um beide Modalitäten gemeinsam zu modellieren, das Modell zu trainieren und gemeinsame latente Repräsentationen zu extrahieren, die sowohl RNA- als auch Protein-Variation erfassen.
Spatial-Transkriptomik-Deconvolution
Ich habe einen Single-Cell-Referenzdatensatz mit Zelltyp-Annotationen und einen Spatial-Transkriptomik-Datensatz mit Spot-Level-Zählwerten. Hilf mir, DestVI oder Stereoscope zu verwenden, um Zelltypen in den räumlichen Daten zu dekonvolvieren und Zelltyp-Proportionskarten zu erstellen.

Bewährte Verfahren

  • Stelle immer rohe, nicht normalisierte Zähldaten für scvi-tools-Modelle für akkurate probabilistische Modellierung bereit
  • Registriere alle bekannten technischen Kovariaten (Batch, Spender, Protokoll) während der Einrichtung, um die Batch-Korrektur zu verbessern
  • Speichere trainierte Modelle regelmäßig mit model.save(), um ein erneutes Training großer Datensätze zu vermeiden
  • Verwende GPU-Beschleunigung (accelerator="gpu") beim Training von Datensätzen mit mehr als 50.000 Zellen

Vermeiden

  • Verwende keine log-normalisierten Daten als Eingabe - scvi-tools-Modelle erwarten Rohdaten
  • Überspringe nicht die Datenfilterung (niedrig gezählte Gene/Zellen) vor dem Training, da dies die Modellqualität beeinflusst
  • Interpretiere latente Repräsentationen nicht ohne Validierung anhand bekannter biologischer Marker
  • Verwende scvi-tools nicht für Bulk-RNA-seq-Analysen - es ist speziell für Single-Cell-Daten konzipiert

Häufig gestellte Fragen

Was ist der Unterschied zwischen scVI und scanpy für Single-Cell-Analysen?
scvi-tools verwendet tiefe generative Modelle mit variativer Inferenz, um probabilistische Repräsentationen von Single-Cell-Daten zu lernen, und bietet Unsicherheitsquantifizierung und überlegene Batch-Korrektur. Scanpy bietet traditionelle Dimensionsreduktion (PCA, UMAP) und Clustering-Methoden. Verwende scvi-tools für fortgeschrittene Modellierung und Batch-Korrektur, scanpy für Standard-Pipelines und nachgelagerte Analysen.
Benötige ich eine GPU für scvi-tools?
Eine GPU wird empfohlen, ist aber nicht erforderlich. Für Datensätze mit weniger als 50.000 Zellen ist CPU-Training machbar. Für größere Datensätze oder häufige Analysen reduziert GPU-Beschleunigung die Trainingszeit erheblich. Installation mit GPU-Unterstützung: pip install scvi-tools[cuda]
Welche Datenformate unterstützt scvi-tools?
scvi-tools funktioniert mit AnnData-Objekten aus dem Scanpy-Ecosystem. Daten sollten in der .X-Matrix als Rohzahlen gespeichert werden. Zell-Level-Kovariaten (Batch, Spender) und Gen-Level-Informationen werden mit model.setup_anndata() registriert. Unterstützung für Seurat-Objekte ist durch Konversion verfügbar.
Wie wähle ich zwischen scVI, scANVI und totalVI?
Verwende scVI für unüberwachte Analyse ohne Zelltyp-Labels. Verwende scANVI, wenn du einige Zelltyp-Annotationen hast und halb-überwachte Integration möchtest. Verwende totalVI für gepaarte RNA- und Protein-Daten (CITE-seq), um beide Modalitäten gemeinsam zu modellieren.
Was gibt die differential_expression-Methode zurück?
Es gibt ein DataFrame mit Gen-Level-Statistiken zurück, einschließlich: bayes_factor (Evidenz für differentielle Expression), is_de_fdr_0.05 (FDR-korrigierte Signifikanz), mean (durchschnittliche Expression pro Gruppe) und Effektgrößen-Schätzungen. Ein höherer bayes_factor zeigt stärkere Evidenz für differentielle Expression.
Wie speichere und lade ich trainierte scvi-tools-Modelle?
Verwende model.save("pfad/zum/modell", overwrite=True) zum Speichern und model = scvi.model.SCVI.load("pfad/zum/modell", adata=new_adata) zum Laden. Das gespeicherte Modell enthält Modellgewichte, Trainingshistorie und Konfiguration. Dies ermöglicht das Teilen von Modellen und vermeidet erneutes Training.