scvi-tools
Single-Cell-Genomik-Daten analysieren
Auch verfügbar von: davila7
Single-Cell-Genomik-Analysen erfordern probabilistische Modelle, um technisches Rauschen und Batch-Effekte zu bewältigen. scvi-tools bietet tiefe generativ Modelle mit variativer Inferenz für Dimensionsreduktion, Batch-Korrektur, differentielle Expression und multimodale Integration von Single-Cell-Daten.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "scvi-tools". Hilf mir, scVI für Batch-Korrektur auf meinem Single-Cell-Datensatz mit zwei Batches einzurichten.
Erwartetes Ergebnis:
```python
import scvi
import scanpy as sc
# Preprocess data
adata = sc.read_h5ad("my_single_cell_data.h5ad")
sc.pp.filter_genes(adata, min_counts=3)
# Register data with batch information
scvi.model.SCVI.setup_anndata(
adata,
layer="counts",
batch_key="batch"
)
# Train model
model = scvi.model.SCVI(adata)
model.train()
# Get batch-corrected latent representation
latent = model.get_latent_representation()
adata.obsm["X_scVI"] = latent
# Downstream analysis
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)
```
Verwendung von "scvi-tools". Wie identifiziere ich Markergene zwischen zwei Zelltypen in meinem scVI-Modell?
Erwartetes Ergebnis:
```python
# Differential expression between two groups
de_results = model.differential_expression(
groupby="leiden",
group1="0", # Cluster 0
group2="1", # Cluster 1
mode="change",
delta=0.25 # Minimum effect size
)
# View top differentially expressed genes
print(de_results.head(20))
# Filter for significant genes
significant_genes = de_results[
(de_results['is_de_fdr_0.05']) &
(de_results['bayes_factor'] > 1)
]
print(f"Found {len(significant_genes)} differentially expressed genes")
```
Sicherheitsaudit
Niedriges RisikoThis is a documentation-only skill containing markdown reference files for scvi-tools, a legitimate Python library for single-cell genomics analysis. All 399 static findings are false positives caused by incorrect pattern matching: Python code examples in documentation were flagged as shell commands, bioinformatics statistical terms were misidentified as cryptographic algorithms, and documentation URLs were flagged as hardcoded URLs. No executable code or malicious patterns exist. Safe for publication.
Risikofaktoren
🌐 Netzwerkzugriff (1)
📁 Dateisystemzugriff
Qualitätsbewertung
Was du bauen kannst
Batch-Korrektur für integrierte Single-Cell-Analyse
Entfernen technischer Batch-Effekte aus Single-Cell-RNA-seq-Datensätzen über mehrere Spender, Protokolle oder Sequenzierungsläufe hinweg mit scVI zur Erstellung einheitlicher, integrierter Zell-Atlanten.
Differentielle Expression mit Unsicherheit
Identifizieren differentiell exprimierter Gene zwischen Zelltypen oder Bedingungen mit probabilistischen Unsicherheitsschätzungen, die zuverlässigere statistische Schlussfolgerungen für nachgelagerte Validierungen liefern.
Multimodale Datenintegration
Gemeinsame Analyse gepaarter RNA- und Proteinmessungen (CITE-seq) oder Chromatin-Zugänglichkeitsdaten zur Entdeckung von Zellpopulationen mit erhöhter biologischer Auflösung.
Probiere diese Prompts
Hilf mir, scvi-tools einzurichten, um meine Single-Cell-RNA-seq-Daten zu analysieren. Ich habe ein AnnData-Objekt mit Rohdaten und möchte eine Batch-Korrektur durchführen. Zeige mir, wie ich die Daten registriere, das Modell trainiere und latente Repräsentationen extrahiere.
Ich habe ein scVI-Modell auf meinem Single-Cell-Datensatz mit Zelltyp-Annotationen trainiert. Hilf mir, differentiell exprimierte Gene zwischen zwei Zelltypen zu identifizieren (z.B. Cluster A vs. Cluster B) mit der differential_expression-Methode. Inklusive wie ich die Ergebnisse interpretiere und Effektgrößen-Schwellenwerte setze.
Ich habe gepaarte CITE-seq-Daten mit RNA-Zählwerten und Protein-Antikörper-abgeleiteten Zählwerten. Hilf mir, totalVI einzurichten, um beide Modalitäten gemeinsam zu modellieren, das Modell zu trainieren und gemeinsame latente Repräsentationen zu extrahieren, die sowohl RNA- als auch Protein-Variation erfassen.
Ich habe einen Single-Cell-Referenzdatensatz mit Zelltyp-Annotationen und einen Spatial-Transkriptomik-Datensatz mit Spot-Level-Zählwerten. Hilf mir, DestVI oder Stereoscope zu verwenden, um Zelltypen in den räumlichen Daten zu dekonvolvieren und Zelltyp-Proportionskarten zu erstellen.
Bewährte Verfahren
- Stelle immer rohe, nicht normalisierte Zähldaten für scvi-tools-Modelle für akkurate probabilistische Modellierung bereit
- Registriere alle bekannten technischen Kovariaten (Batch, Spender, Protokoll) während der Einrichtung, um die Batch-Korrektur zu verbessern
- Speichere trainierte Modelle regelmäßig mit model.save(), um ein erneutes Training großer Datensätze zu vermeiden
- Verwende GPU-Beschleunigung (accelerator="gpu") beim Training von Datensätzen mit mehr als 50.000 Zellen
Vermeiden
- Verwende keine log-normalisierten Daten als Eingabe - scvi-tools-Modelle erwarten Rohdaten
- Überspringe nicht die Datenfilterung (niedrig gezählte Gene/Zellen) vor dem Training, da dies die Modellqualität beeinflusst
- Interpretiere latente Repräsentationen nicht ohne Validierung anhand bekannter biologischer Marker
- Verwende scvi-tools nicht für Bulk-RNA-seq-Analysen - es ist speziell für Single-Cell-Daten konzipiert
Häufig gestellte Fragen
Was ist der Unterschied zwischen scVI und scanpy für Single-Cell-Analysen?
Benötige ich eine GPU für scvi-tools?
Welche Datenformate unterstützt scvi-tools?
Wie wähle ich zwischen scVI, scANVI und totalVI?
Was gibt die differential_expression-Methode zurück?
Wie speichere und lade ich trainierte scvi-tools-Modelle?
Entwicklerdetails
Autor
K-Dense-AILizenz
BSD-3-Clause license
Repository
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/scvi-toolsRef
main