scvi-tools
Analisar dados de genômica de célula única
Também disponível em: davila7
A análise de genômica de célula única requer modelos probabilísticos para lidar com ruído técnico e efeitos de lote. scvi-tools fornece modelos generativos profundos usando inferência variacional para redução de dimensionalidade, correção de lote, expressão diferencial e integração multimodal de dados de célula única.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "scvi-tools". Ajude-me a configurar scVI para correção de lote no meu conjunto de dados de célula única com dois lotes.
Resultado esperado:
```python
import scvi
import scanpy as sc
# Preprocess data
adata = sc.read_h5ad("my_single_cell_data.h5ad")
sc.pp.filter_genes(adata, min_counts=3)
# Register data with batch information
scvi.model.SCVI.setup_anndata(
adata,
layer="counts",
batch_key="batch"
)
# Train model
model = scvi.model.SCVI(adata)
model.train()
# Get batch-corrected latent representation
latent = model.get_latent_representation()
adata.obsm["X_scVI"] = latent
# Downstream analysis
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)
```
A utilizar "scvi-tools". Como identifico genes marcadores entre dois tipos celulares no meu modelo scVI?
Resultado esperado:
```python
# Differential expression between two groups
de_results = model.differential_expression(
groupby="leiden",
group1="0", # Cluster 0
group2="1", # Cluster 1
mode="change",
delta=0.25 # Minimum effect size
)
# View top differentially expressed genes
print(de_results.head(20))
# Filter for significant genes
significant_genes = de_results[
(de_results['is_de_fdr_0.05']) &
(de_results['bayes_factor'] > 1)
]
print(f"Found {len(significant_genes)} differentially expressed genes")
```
Auditoria de Segurança
Baixo RiscoThis is a documentation-only skill containing markdown reference files for scvi-tools, a legitimate Python library for single-cell genomics analysis. All 399 static findings are false positives caused by incorrect pattern matching: Python code examples in documentation were flagged as shell commands, bioinformatics statistical terms were misidentified as cryptographic algorithms, and documentation URLs were flagged as hardcoded URLs. No executable code or malicious patterns exist. Safe for publication.
Fatores de risco
🌐 Acesso à rede (1)
📁 Acesso ao sistema de arquivos
Pontuação de qualidade
O Que Você Pode Construir
Correção de lote para análise integrada de célula única
Remover efeitos técnicos de lote de conjuntos de dados de RNA-seq de célula única entre múltiplos doadores, protocolos ou sequenciamentos usando scVI para criar atlas celulares unificados e integrados.
Expressão diferencial com incerteza
Identificar genes diferencialmente expressos entre tipos celulares ou condições com estimativas probabilísticas de incerteza, fornecendo conclusões estatísticas mais confiáveis para validação downstream.
Integração de dados multimodais
Analisar conjuntamente medições pareadas de RNA e proteína (CITE-seq) ou dados de acessibilidade de cromatina para descobrir populações celulares com resolução biológica aprimorada.
Tente Estes Prompts
Ajude-me a configurar scvi-tools para analisar meus dados de RNA-seq de célula única. Tenho um objeto AnnData com dados de contagem bruta e quero realizar correção de lote. Mostre-me como registrar os dados, treinar o modelo e extrair representações latentes.
Treinei um modelo scVI no meu conjunto de dados de célula única com anotações de tipo celular. Ajude-me a identificar genes diferencialmente expressos entre dois tipos celulares (ex: cluster A vs cluster B) usando o método differential_expression. Inclua como interpretar os resultados e definir limiares de tamanho de efeito.
Tenho dados pareados de CITE-seq com contagens de RNA e contagens derivadas de anticorpos de proteína. Ajude-me a configurar totalVI para modelar conjuntamente ambas as modalidades, treinar o modelo e extrair representações latentes conjuntas que capturem variação tanto de RNA quanto de proteína.
Tenho um conjunto de dados de referência de célula única com anotações de tipo celular e um conjunto de dados de transcriptômica espacial com contagens em nível de spot. Ajude-me a usar DestVI ou Stereoscope para desconvoluir tipos celulares nos dados espaciais e criar mapas de proporção de tipos celulares.
Melhores Práticas
- Sempre forneça dados de contagem brutos e não normalizados para modelos scvi-tools para modelagem probabilística precisa
- Registre todas as covariáveis técnicas conhecidas (lote, doador, protocolo) durante a configuração para melhorar a correção de lote
- Salve modelos treinados regularmente usando model.save() para evitar retreinamento em grandes conjuntos de dados
- Use aceleração por GPU (accelerator="gpu") ao treinar em conjuntos de dados com mais de 50.000 células
Evitar
- Não use dados log-normalizados como entrada - modelos scvi-tools esperam dados de contagem bruta
- Não pule a filtragem de dados (genes/células de baixa contagem) antes do treinamento pois afeta a qualidade do modelo
- Não interprete representações latentes sem validação contra marcadores biológicos conhecidos
- Não use scvi-tools para análise de RNA-seq bulk - foi projetado especificamente para dados de célula única
Perguntas Frequentes
Qual é a diferença entre scVI e scanpy para análise de célula única?
Preciso de uma GPU para usar scvi-tools?
Quais formatos de dados o scvi-tools suporta?
Como escolho entre scVI, scANVI e totalVI?
O que o método differential_expression retorna?
Como salvo e carrego modelos scvi-tools treinados?
Detalhes do Desenvolvedor
Autor
K-Dense-AILicença
BSD-3-Clause license
Repositório
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/scvi-toolsReferência
main
Estrutura de arquivos