Habilidades scvi-tools
📦

scvi-tools

Baixo Risco 🌐 Acesso à rede📁 Acesso ao sistema de arquivos

分析单细胞基因组学数据

Também disponível em: davila7

单细胞基因组学分析需要概率模型来处理技术噪声和批次效应。scvi-tools提供使用变分推断的深度生成模型,用于单细胞数据的降维、批次校正、差异表达和多模态整合。

Suporta: Claude Codex Code(CC)
📊 69 Adequado
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "scvi-tools". 帮我设置scVI对我的包含两个批次的单细胞数据集进行批次校正。

Resultado esperado:

```python
import scvi
import scanpy as sc

# Preprocess data
adata = sc.read_h5ad("my_single_cell_data.h5ad")
sc.pp.filter_genes(adata, min_counts=3)

# Register data with batch information
scvi.model.SCVI.setup_anndata(
adata,
layer="counts",
batch_key="batch"
)

# Train model
model = scvi.model.SCVI(adata)
model.train()

# Get batch-corrected latent representation
latent = model.get_latent_representation()
adata.obsm["X_scVI"] = latent

# Downstream analysis
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)
```

A utilizar "scvi-tools". 如何在我的scVI模型中识别两种细胞类型之间的标记基因?

Resultado esperado:

```python
# Differential expression between two groups
de_results = model.differential_expression(
groupby="leiden",
group1="0", # Cluster 0
group2="1", # Cluster 1
mode="change",
delta=0.25 # Minimum effect size
)

# View top differentially expressed genes
print(de_results.head(20))

# Filter for significant genes
significant_genes = de_results[
(de_results['is_de_fdr_0.05']) &
(de_results['bayes_factor'] > 1)
]
print(f"Found {len(significant_genes)} differentially expressed genes")
```

Auditoria de Segurança

Baixo Risco
v5 • 1/21/2026

This is a documentation-only skill containing markdown reference files for scvi-tools, a legitimate Python library for single-cell genomics analysis. All 399 static findings are false positives caused by incorrect pattern matching: Python code examples in documentation were flagged as shell commands, bioinformatics statistical terms were misidentified as cryptographic algorithms, and documentation URLs were flagged as hardcoded URLs. No executable code or malicious patterns exist. Safe for publication.

11
Arquivos analisados
7,698
Linhas analisadas
2
achados
5
Total de auditorias

Fatores de risco

🌐 Acesso à rede (1)
📁 Acesso ao sistema de arquivos
Nenhuma localização específica registrada
Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

45
Arquitetura
100
Manutenibilidade
87
Conteúdo
20
Comunidade
90
Segurança
91
Conformidade com especificações

O Que Você Pode Construir

用于整合单细胞分析的批次校正

使用scVI移除单细胞RNA-seq数据集中的技术批次效应,涵盖多个供体、协议或测序批次,以创建统一、整合的细胞图谱。

带不确定性的差异表达分析

在细胞类型或条件之间识别差异表达基因,并提供概率不确定性估计,为下游验证提供更可靠的统计结论。

多模态数据整合

联合分析配对的RNA和蛋白质测量数据(CITE-seq)或染色质可及性数据,以更高生物分辨率发现细胞群落。

Tente Estes Prompts

基本scVI模型设置
帮我设置scvi-tools来分析我的单细胞RNA-seq数据。我有一个包含原始计数数据的AnnData对象,想要进行批次校正。告诉我如何注册数据、训练模型并提取潜在表示。
差异表达分析
我在带细胞类型注释的单细胞数据集上训练了一个scVI模型。帮我使用differential_expression方法识别两种细胞类型(例如簇A与簇B)之间的差异表达基因。包括如何解释结果和设置效应量阈值。
使用totalVI进行多模态整合
我有配对的CITE-seq数据,包含RNA计数和蛋白质抗体衍生计数。帮我设置totalVI来联合建模两种模态,训练模型,并提取联合潜在表示,捕捉RNA和蛋白质的变化。
空间转录组学去卷积
我有一个带细胞类型注释的单细胞参考数据集和一个带有斑点级计数数据的空间转录组学数据集。帮我使用DestVI或Stereoscope去卷积空间数据中的细胞类型,并创建细胞类型比例图。

Melhores Práticas

  • 始终向scvi-tools模型提供原始、未标准化的计数数据,以实现准确的概率建模
  • 在设置过程中注册所有已知的技术协变量(批次、供体、协议)以改善批次校正
  • 定期使用model.save()保存训练好的模型,避免在大数据集上重新训练
  • 当训练包含超过50,000个细胞的数据集时,使用GPU加速(accelerator="gpu")

Evitar

  • 不要使用对数标准化数据作为输入——scvi-tools模型需要原始计数数据
  • 不要在训练前跳过数据过滤(低计数基因/细胞),因为这会影响模型质量
  • 不要在没有根据已知生物标记物验证的情况下解释潜在表示
  • 不要将scvi-tools用于bulk RNA-seq分析——它专门为单细胞数据设计

Perguntas Frequentes

scVI和scanpy用于单细胞分析有什么区别?
scvi-tools使用带变分推断的深度生成模型来学习单细胞数据的概率表示,提供不确定性和卓越的批次校正。scanpy提供传统的降维(PCA、UMAP)和聚类方法。将scvi-tools用于高级建模和批次校正,scanpy用于标准流程和下游分析。
使用scvi-tools需要GPU吗?
GPU是推荐但不是必需的。对于少于50,000个细胞的数据集,CPU训练是可行的。对于更大的数据集或频繁分析,GPU加速可显著减少训练时间。使用GPU支持安装:pip install scvi-tools[cuda]
scvi-tools支持哪些数据格式?
scvi-tools与scanpy生态系统的AnnData对象配合使用。数据应作为原始计数存储在.X矩阵中。使用model.setup_anndata()注册细胞级协变量(批次、供体)和基因级信息。通过转换可获得对Seurat对象的支持。
如何选择scVI、scANVI和totalVI?
在没有细胞类型标签的情况下使用scVI进行无监督分析。当有部分细胞类型注释并想要半监督整合时使用scANVI。当处理配对的RNA和蛋白质(CITE-seq)数据以联合建模两种模态时使用totalVI。
differential_expression方法返回什么?
它返回一个包含基因级���计信息的DataFrame,包括:bayes_factor(差异表达的证据)、is_de_fdr_0.05(FDR校正显著性)、mean(每组的平均表达量)和效应量估计。bayes_factor越高表示差异表达的证据越强。
如何保存和加载训练好的scvi-tools模型?
使用model.save("path/to/model", overwrite=True)保存,使用model = scvi.model.SCVI.load("path/to/model", adata=new_adata)加载。保存的模型包括模型权重、训练历史和配置。这允许共享模型并避免重新训练。