스킬 scvi-tools
📦

scvi-tools

낮은 위험 🌐 네트워크 접근📁 파일 시스템 액세스

단일세포 유전체 데이터 분석

또한 다음에서 사용할 수 있습니다: davila7

단일세포 유전체 분석에는 기술적 노이즈와 배치 효과를 처리하기 위한 확률적 모델이 필요합니다. scvi-tools는 차원 축소, 배치 보정, 차등 발현 및 단일세포 데이터의 다중 모달 통합을 위한 변분 추론을 사용하는 심층 생성 모델을 제공합니다.

지원: Claude Codex Code(CC)
📊 69 적절함
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"scvi-tools" 사용 중입니다. �� 배치가 있는 내 단일세포 데이터셋에 대해 배치 보정을 위해 scVI를 설정하는 것을 도와주세요.

예상 결과:

```python
import scvi
import scanpy as sc

# 데이터 전처리
adata = sc.read_h5ad("my_single_cell_data.h5ad")
sc.pp.filter_genes(adata, min_counts=3)

# 배치 정보로 데이터 등록
scvi.model.SCVI.setup_anndata(
adata,
layer="counts",
batch_key="batch"
)

# 모델 학습
model = scvi.model.SCVI(adata)
model.train()

# 배치 보정된 잠재 표현 얻기
latent = model.get_latent_representation()
adata.obsm["X_scVI"] = latent

# 하류 분석
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)
```

"scvi-tools" 사용 중입니다. 내 scVI 모델에서 두 세포 유형 간의 마커 유전자를 어떻게 식별하나요?

예상 결과:

```python
# 두 그룹 간 차등 발현
de_results = model.differential_expression(
groupby="leiden",
group1="0", # 클러스터 0
group2="1", # 클러스터 1
mode="change",
delta=0.25 # 최소 효과 크기
)

# 상위 차등 발현 유전자 보기
print(de_results.head(20))

# 유의미한 유전자 필터링
significant_genes = de_results[
(de_results['is_de_fdr_0.05']) &
(de_results['bayes_factor'] > 1)
]
print(f"차등 발현 유전자 {len(significant_genes)}개 발견")
```

보안 감사

낮은 위험
v5 • 1/21/2026

This is a documentation-only skill containing markdown reference files for scvi-tools, a legitimate Python library for single-cell genomics analysis. All 399 static findings are false positives caused by incorrect pattern matching: Python code examples in documentation were flagged as shell commands, bioinformatics statistical terms were misidentified as cryptographic algorithms, and documentation URLs were flagged as hardcoded URLs. No executable code or malicious patterns exist. Safe for publication.

11
스캔된 파일
7,698
분석된 줄 수
2
발견 사항
5
총 감사 수

위험 요인

🌐 네트워크 접근 (1)
📁 파일 시스템 액세스
기록된 특정 위치가 없습니다
감사자: claude 감사 이력 보기 →

품질 점수

45
아키텍처
100
유지보수성
87
콘텐츠
20
커뮤니티
90
보안
91
사양 준수

만들 수 있는 것

통합 단일세포 분석을 위한 배치 보정

여러 공여자, 프로토콜 또는 시퀀싱 런에 걸친 단일세포 RNA-seq 데이터셋에서 기술적 배치 효과를 scVI를 사용하여 제거하고 통합된 통합 세� 아틀라스를 생성합니다.

불확실성을 포함한 차등 발현

확률적 불확실성 추정과 함께 세포 유형 또는 조건 간에 차등적으로 발현되는 유전자를 식별하여 하류 검증에 대한 더 신뢰할 수 있는 통계적 결론을 제공합니다.

다중 모달 데이터 통합

쌍을 이룬 RNA 및 단백질 측정(CITE-seq) 또는 크로마틴 접근성 데이터를 공동 분석하여 향상된 생물학적 분해능으로 세� 집단을 발견합니다.

이 프롬프트를 사용해 보세요

기본 scVI 모델 설정
내 단일세포 RNA-seq 데이터를 분석하기 위해 scvi-tools 설정하는 것을 도와주세요. 원시 카운트 데이터가 있는 AnnData 개체가 있고 배치 보정을 수행하고 싶습니다. 데이터를 등록하고, 모델을 학습하며, 잠재 표현을 추출하는 방법을 보여주세요.
차등 발현 분석
내 단일세포 데이터셋에서 세포 유형 주석으로 scVI 모델을 학습했습니다. differential_expression 메서드를 사용하여 두 세포 유형(예: 클러스터 A vs 클러스터 B) 간에 차등적으로 발현되는 유전자를 식별하는 것을 도와주세요. 결과를 해석하고 효과 크기 임계값을 설정하는 방법을 포함하세요.
totalVI를 사용한 다중 모달 통합
RNA 카운트와 단파생 단백질 카운트가 있는 쌍을 이룬 CITE-seq 데이터가 있습니다. totalVI를 설정하여 두 모달리티를 공동으로 모델링하고, 모델을 학습하며, RNA와 단백질 변동을 모두 포착하는 공동 잠재 표현을 추출하는 것을 도와주세요.
공간 전사체학 역추론
세포 유형 주석이 있는 단일세포 기준 데이터셋과 스팟 수준의 카운트가 있는 공간 전사체학 데이터셋이 있습니다. DestVI 또는 Sterecope를 사용하여 공간 데이터에서 세포 유형을 역추론하고 세포 유형 비율 맵을 생성하는 것을 도와주세요.

모범 사례

  • 정확한 확률적 모델링을 위해 scvi-tools 모델에 원시, 정규화되지 않은 카운트 데이터를 항상 제공하세요
  • 배치 보정을 개선하기 위해 설정 시 모든 알려진 기술 공변량(배치, 공여자, 프로토콜)을 등록하세요
  • 대규모 데이터셋 재학습을 피하기 위해 model.save()를 사용하여 학습된 모델을 정기적으로 저장하세요
  • 50,000개 이상의 세포가 있는 데이터셋을 학습할 때 GPU 가속(accelerator="gpu")을 사용하세요

피하기

  • 로그 정규화된 데이터를 입력으로 사용하지 마세요 - scvi-tools 모델은 원시 카운트 데이터를 기대합니다
  • 학습 전 데이터 필터링(저카운트 유전자/세포)을 건너뛰지 마세요 - 모델 품질에 영향을 미칩니다
  • 잠재 표현을 알려진 생물학적 마커에 대한 검증 없이 해석하지 마세요
  • scvi-tools를 bulk RNA-seq 분석에 사용하지 마세요 - 단일세포 데이터에 특화되어 설계되었습니다

자주 묻는 질문

단일세포 분석에서 scVI와 scanpy의 차이점은 무엇인가요?
scvi-tools는 단일세포 데이터의 확률적 표현을 학습하고 불확실성 정량화 및 우수한 배치 보정을 제공하는 변분 추론을 사용한 심층 생성 모델을 사용합니다. scanpy는 전통적인 차원 축소(PCA, UMAP) 및 클러스터링 방법을 제공합니다. 고급 모델링 및 배치 보정에는 scvi-tools를, 표준 파이프라인 및 하류 분석에는 scanpy를 사용하세요.
scvi-tools를 사용하기 위해 GPU가 필요한가요?
GPU는 권장되지만 필수 사항은 아닙니다. 50,000개 미만의 세포가 있는 데이터셋의 경우 CPU 학습이 가능합니다. 더 큰 데이터셋이나 빈번한 분석의 경우 GPU 가속이 학습 시간을 크게 단축합니다. GPU 지원으로 설치: pip install scvi-tools[cuda]
scvi-tools는 어떤 데이터 형식을 지원하나요?
scvi-tools는 scanpy 생태계의 AnnData 객체와 함께 작동합니다. 데이터는 원시 카운트로 .X 매트릭스에 저장되어야 합니다. 세포 수준 공변량(배치, 공여자)과 유전자 수준 정보는 model.setup_anndata()를 사용하여 등록됩니다. 변환을 통해 Seurat 객체 지원이 제공됩니다.
scVI, scANVI, totalVI 중 어떻게 선택하나요?
세포 유형 레이블 없이 비지도 분석에는 scVI를 사용하세요. 일부 세포 유형 주석이 있고半지도 통합을 원하는 경우 scANVI를 사용하세요. 쌍을 이룬 RNA 및 단파생 단백질(CITE-seq) 데이터를 공동으로 모델링하려면 totalVI를 사용하세요.
differential_expression 메서드는 무엇을 반환하나요?
유전자 수준 통계를 포함한 DataFrame을 반환합니다: bayes_factor(차등 발현에 대한 증거), is_de_fdr_0.05(FDR 보정된 유의성), mean(그룹별 평균 발현), 효과 크기 추정치. bayes_factor가 높을수록 차등 발현에 대한 증거가 더 강합니다.
학습된 scvi-tools 모델을 어떻게 저장하고 로드하나요?
저장하려면 model.save("path/to/model", overwrite=True)를 사용하고 로드하려면 model = scvi.model.SCVI.load("path/to/model", adata=new_adata)를 사용하세요. 저장된 모델에는 모델 가중치, 학습 기록 및 구성이 포함됩니다. 이를 통해 모델을 공유하고 재학습을 피할 수 있습니다.