단일세포 유전체 분석에는 기술적 노이즈와 배치 효과를 처리하기 위한 확률적 모델이 필요합니다. scvi-tools는 차원 축소, 배치 보정, 차등 발현 및 단일세포 데이터의 다중 모달 통합을 위한 변분 추론을 사용하는 심층 생성 모델을 제공합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"scvi-tools" 사용 중입니다. �� 배치가 있는 내 단일세포 데이터셋에 대해 배치 보정을 위해 scVI를 설정하는 것을 도와주세요.
예상 결과:
```python
import scvi
import scanpy as sc
# 데이터 전처리
adata = sc.read_h5ad("my_single_cell_data.h5ad")
sc.pp.filter_genes(adata, min_counts=3)
# 배치 정보로 데이터 등록
scvi.model.SCVI.setup_anndata(
adata,
layer="counts",
batch_key="batch"
)
# 모델 학습
model = scvi.model.SCVI(adata)
model.train()
# 배치 보정된 잠재 표현 얻기
latent = model.get_latent_representation()
adata.obsm["X_scVI"] = latent
# 하류 분석
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)
```
"scvi-tools" 사용 중입니다. 내 scVI 모델에서 두 세포 유형 간의 마커 유전자를 어떻게 식별하나요?
예상 결과:
```python
# 두 그룹 간 차등 발현
de_results = model.differential_expression(
groupby="leiden",
group1="0", # 클러스터 0
group2="1", # 클러스터 1
mode="change",
delta=0.25 # 최소 효과 크기
)
# 상위 차등 발현 유전자 보기
print(de_results.head(20))
# 유의미한 유전자 필터링
significant_genes = de_results[
(de_results['is_de_fdr_0.05']) &
(de_results['bayes_factor'] > 1)
]
print(f"차등 발현 유전자 {len(significant_genes)}개 발견")
```
보안 감사
낮은 위험This is a documentation-only skill containing markdown reference files for scvi-tools, a legitimate Python library for single-cell genomics analysis. All 399 static findings are false positives caused by incorrect pattern matching: Python code examples in documentation were flagged as shell commands, bioinformatics statistical terms were misidentified as cryptographic algorithms, and documentation URLs were flagged as hardcoded URLs. No executable code or malicious patterns exist. Safe for publication.
위험 요인
🌐 네트워크 접근 (1)
📁 파일 시스템 액세스
품질 점수
만들 수 있는 것
통합 단일세포 분석을 위한 배치 보정
여러 공여자, 프로토콜 또는 시퀀싱 런에 걸친 단일세포 RNA-seq 데이터셋에서 기술적 배치 효과를 scVI를 사용하여 제거하고 통합된 통합 세� 아틀라스를 생성합니다.
불확실성을 포함한 차등 발현
확률적 불확실성 추정과 함께 세포 유형 또는 조건 간에 차등적으로 발현되는 유전자를 식별하여 하류 검증에 대한 더 신뢰할 수 있는 통계적 결론을 제공합니다.
다중 모달 데이터 통합
쌍을 이룬 RNA 및 단백질 측정(CITE-seq) 또는 크로마틴 접근성 데이터를 공동 분석하여 향상된 생물학적 분해능으로 세� 집단을 발견합니다.
이 프롬프트를 사용해 보세요
내 단일세포 RNA-seq 데이터를 분석하기 위해 scvi-tools 설정하는 것을 도와주세요. 원시 카운트 데이터가 있는 AnnData 개체가 있고 배치 보정을 수행하고 싶습니다. 데이터를 등록하고, 모델을 학습하며, 잠재 표현을 추출하는 방법을 보여주세요.
내 단일세포 데이터셋에서 세포 유형 주석으로 scVI 모델을 학습했습니다. differential_expression 메서드를 사용하여 두 세포 유형(예: 클러스터 A vs 클러스터 B) 간에 차등적으로 발현되는 유전자를 식별하는 것을 도와주세요. 결과를 해석하고 효과 크기 임계값을 설정하는 방법을 포함하세요.
RNA 카운트와 단파생 단백질 카운트가 있는 쌍을 이룬 CITE-seq 데이터가 있습니다. totalVI를 설정하여 두 모달리티를 공동으로 모델링하고, 모델을 학습하며, RNA와 단백질 변동을 모두 포착하는 공동 잠재 표현을 추출하는 것을 도와주세요.
세포 유형 주석이 있는 단일세포 기준 데이터셋과 스팟 수준의 카운트가 있는 공간 전사체학 데이터셋이 있습니다. DestVI 또는 Sterecope를 사용하여 공간 데이터에서 세포 유형을 역추론하고 세포 유형 비율 맵을 생성하는 것을 도와주세요.
모범 사례
- 정확한 확률적 모델링을 위해 scvi-tools 모델에 원시, 정규화되지 않은 카운트 데이터를 항상 제공하세요
- 배치 보정을 개선하기 위해 설정 시 모든 알려진 기술 공변량(배치, 공여자, 프로토콜)을 등록하세요
- 대규모 데이터셋 재학습을 피하기 위해 model.save()를 사용하여 학습된 모델을 정기적으로 저장하세요
- 50,000개 이상의 세포가 있는 데이터셋을 학습할 때 GPU 가속(accelerator="gpu")을 사용하세요
피하기
- 로그 정규화된 데이터를 입력으로 사용하지 마세요 - scvi-tools 모델은 원시 카운트 데이터를 기대합니다
- 학습 전 데이터 필터링(저카운트 유전자/세포)을 건너뛰지 마세요 - 모델 품질에 영향을 미칩니다
- 잠재 표현을 알려진 생물학적 마커에 대한 검증 없이 해석하지 마세요
- scvi-tools를 bulk RNA-seq 분석에 사용하지 마세요 - 단일세포 데이터에 특화되어 설계되었습니다