単一細胞ゲノミクス解析には、技術的ノイズやバッチ効果を処理するための確率モデルが必要です。scvi-toolsは、変分推論を用いた深層生成モデルを提供し、単一細胞データの次元削減、バッチ補正、差次的発現解析、マルチモーダル統合を実現します。
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「scvi-tools」を使用しています。 2つのバッチを含む単一細胞データセットでバッチ補正のためにscVIをセットアップする方法を教えてください。
期待される結果:
```python
import scvi
import scanpy as sc
# Preprocess data
adata = sc.read_h5ad("my_single_cell_data.h5ad")
sc.pp.filter_genes(adata, min_counts=3)
# Register data with batch information
scvi.model.SCVI.setup_anndata(
adata,
layer="counts",
batch_key="batch"
)
# Train model
model = scvi.model.SCVI(adata)
model.train()
# Get batch-corrected latent representation
latent = model.get_latent_representation()
adata.obsm["X_scVI"] = latent
# Downstream analysis
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)
```
「scvi-tools」を使用しています。 scVIモデルで2つの細胞タイプ間のマーカー遺伝子を特定するにはどうすればよいですか?
期待される結果:
```python
# Differential expression between two groups
de_results = model.differential_expression(
groupby="leiden",
group1="0", # Cluster 0
group2="1", # Cluster 1
mode="change",
delta=0.25 # Minimum effect size
)
# View top differentially expressed genes
print(de_results.head(20))
# Filter for significant genes
significant_genes = de_results[
(de_results['is_de_fdr_0.05']) &
(de_results['bayes_factor'] > 1)
]
print(f"Found {len(significant_genes)} differentially expressed genes")
```
セキュリティ監査
低リスクThis is a documentation-only skill containing markdown reference files for scvi-tools, a legitimate Python library for single-cell genomics analysis. All 399 static findings are false positives caused by incorrect pattern matching: Python code examples in documentation were flagged as shell commands, bioinformatics statistical terms were misidentified as cryptographic algorithms, and documentation URLs were flagged as hardcoded URLs. No executable code or malicious patterns exist. Safe for publication.
リスク要因
🌐 ネットワークアクセス (1)
📁 ファイルシステムへのアクセス
品質スコア
作れるもの
統合単一細胞解析のためのバッチ補正
scVIを使用して、複数のドナー、プロトコル、シーケンスランにわたる単一細胞RNA-seqデータセットから技術的バッチ効果を除去し、統一された統合細胞アトラスを作成します。
不確実性を伴う差次的発現
確率的不確実性推定を用いて、細胞タイプや条件間で差次的に発現する遺伝子を特定し、下流検証のためのより信頼性の高い統計的結論を提供します。
マルチモーダルデータ統合
ペアになったRNAとタンパク質測定(CITE-seq)またはクロマチンアクセシビリティデータを共同で解析し、生物学的解像度を高めた細胞集団を発見します。
これらのプロンプトを試す
単一細胞RNA-seqデータを解析するためのscvi-toolsのセットアップを手伝ってください。生カウントデータを含むAnnDataオブジェクトがあり、バッチ補正を実行したいです。データの登録、モデルの訓練、潜在表現の抽出方法を教えてください。
細胞タイプアノテーションを含む単一細胞データセットでscVIモデルを訓練しました。differential_expressionメソッドを使用して、2つの細胞タイプ(例:クラスターAとクラスターB)間で差次的に発現する遺伝子を特定する方法を教えてください。結果の解釈方法と効果サイズの閾値設定方法も含めてください。
RNAカウントとタンパク質抗体由来カウントを含むペアのCITE-seqデータがあります。totalVIを設定して両方のモダリティを共同でモデル化し、モデルを訓練し、RNAとタンパク質の両方の変動を捉える共同潜在表現を抽出する方法を教えてください。
細胞タイプアノテーションを含む単一細胞リファレンスデータセットと、スポットレベルのカウントを含む空間トランスクリプトミクスデータセットがあります。DestVIまたはStereoscopeを使用して空間データ内の細胞タイプをデコンボリューションし、細胞タイプ比率マップを作成する方法を教えてください。
ベストプラクティス
- 正確な確率的モデリングのために、常に生の正規化されていないカウントデータをscvi-toolsモデルに提供する
- バッチ補正を改善するために、セットアップ中に既知のすべての技術的共変量(バッチ、ドナー、プロトコル)を登録する
- 大規模データセットでの再訓練を避けるために、model.save()を使用して訓練済みモデルを定期的に保存する
- 5万細胞以上のデータセットで訓練する際は、GPUアクセラレーション(accelerator="gpu")を使用する
回避
- 対数正規化されたデータを入力として使用しない - scvi-toolsモデルは生カウントデータを期待します
- 訓練前にデータフィルタリング(低カウント遺伝子/細胞)をスキップしない - モデル品質に影響します
- 既知の生物学的マーカーに対する検証なしに潜在表現を解釈しない
- バルクRNA-seq解析にscvi-toolsを使用しない - 単一細胞データ専用に設計されています