Навыки scvi-tools
📦

scvi-tools

Низкий риск 🌐 Доступ к сети📁 Доступ к файловой системе

Анализ данных одноклеточной геномики

Также доступно от: davila7

Анализ одноклеточной геномики требует вероятностных моделей для обработки технического шума и пакетных эффектов. scvi-tools предоставляет глубокие генеративные модели с использованием вариационного вывода для уменьшения размерности, коррекции пакетных эффектов, дифференциальной экспрессии и мультимодальной интеграции данных одиночных клеток.

Поддерживает: Claude Codex Code(CC)
📊 69 Адекватно
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «scvi-tools». Help me set up scVI for batch correction on my single-cell dataset with two batches.

Ожидаемый результат:

```python
import scvi
import scanpy as sc

# Preprocess data
adata = sc.read_h5ad("my_single_cell_data.h5ad")
sc.pp.filter_genes(adata, min_counts=3)

# Register data with batch information
scvi.model.SCVI.setup_anndata(
adata,
layer="counts",
batch_key="batch"
)

# Train model
model = scvi.model.SCVI(adata)
model.train()

# Get batch-corrected latent representation
latent = model.get_latent_representation()
adata.obsm["X_scVI"] = latent

# Downstream analysis
sc.pp.neighbors(adata, use_rep="X_scVI")
sc.tl.umap(adata)
sc.tl.leiden(adata)
```

Использование «scvi-tools». How do I identify marker genes between two cell types in my scVI model?

Ожидаемый результат:

```python
# Differential expression between two groups
de_results = model.differential_expression(
groupby="leiden",
group1="0", # Cluster 0
group2="1", # Cluster 1
mode="change",
delta=0.25 # Minimum effect size
)

# View top differentially expressed genes
print(de_results.head(20))

# Filter for significant genes
significant_genes = de_results[
(de_results['is_de_fdr_0.05']) &
(de_results['bayes_factor'] > 1)
]
print(f"Found {len(significant_genes)} differentially expressed genes")
```

Аудит безопасности

Низкий риск
v5 • 1/21/2026

This is a documentation-only skill containing markdown reference files for scvi-tools, a legitimate Python library for single-cell genomics analysis. All 399 static findings are false positives caused by incorrect pattern matching: Python code examples in documentation were flagged as shell commands, bioinformatics statistical terms were misidentified as cryptographic algorithms, and documentation URLs were flagged as hardcoded URLs. No executable code or malicious patterns exist. Safe for publication.

11
Просканировано файлов
7,698
Проанализировано строк
2
находки
5
Всего аудитов

Факторы риска

🌐 Доступ к сети (1)
📁 Доступ к файловой системе
Конкретные расположения не записаны

Оценка качества

45
Архитектура
100
Сопровождаемость
87
Контент
20
Сообщество
90
Безопасность
91
Соответствие спецификации

Что вы можете построить

Коррекция пакетных эффектов для интегрированного анализа одиночных клеток

Устранение технических пакетных эффектов из наборов данных РНК-секвенирования одиночных клеток от различных доноров, протоколов или серий секвенирования с использованием scVI для создания унифицированных интегрированных клеточных атласов.

Дифференциальная экспрессия с неопределённостью

Идентификация дифференциально экспрессируемых генов между типами клеток или состояниями с вероятностными оценками неопределённости, обеспечивающая более надёжные статистические выводы для последующей валидации.

Мультимодальная интеграция данных

Совместный анализ парных измерений РНК и белков (CITE-seq) или данных о доступности хроматина для обнаружения популяций клеток с повышенным биологическим разрешением.

Попробуйте эти промпты

Базовая настройка модели scVI
Помогите мне настроить scvi-tools для анализа моих данных РНК-секвенирования одиночных клеток. У меня есть объект AnnData с необработанными данными подсчётов, и я хочу выполнить коррекцию пакетных эффектов. Покажите, как зарегистрировать данные, обучить модель и извлечь латентные представления.
Дифференциальный экспрессионный анализ
Я обучил модель scVI на наборе данных одиночных клеток с аннотациями типов клеток. Помогите идентифицировать дифференциально экспрессируемые гены между двумя типами клеток (например, кластер A против кластера B) с использованием метода differential_expression. Включите интерпретацию результатов и установление порогов размера эффекта.
Мультимодальная интеграция с totalVI
У меня есть парные данные CITE-seq с подсчётами РНК и белковыми антителами. Помогите настроить totalVI для совместного моделирования обеих модальностей, обучить модель и извлечь совместные латентные представления, которые отражают вариацию как РНК, так и белков.
Деконволюция пространственной транскриптомики
У меня есть эталонный набор данных одиночных клеток с аннотациями типов клеток и набор данных пространственной транскриптомики с подсчётами на уровне пятен. Помогите использовать DestVI или Stereoscope для деконволюции типов клеток в пространственных данных и создания карт пропорций типов клеток.

Лучшие практики

  • Всегда предоставляйте необработанные, ненормализованные данные подсчётов моделям scvi-tools для точного вероятностного моделирования
  • Регистрируйте все известные технические коварианты (пакет, донор, протокол) во время настройки для улучшения коррекции пакетных эффектов
  • Регулярно сохраняйте обученные модели с помощью model.save(), чтобы избежать повторного обучения на больших наборах данных
  • Используйте ускорение на GPU (accelerator="gpu") при обучении наборов данных с более чем 50 000 клеток

Избегать

  • Не используйте лог-нормализованные данные в качестве входных данных - модели scvi-tools ожидают необработанные данные подсчётов
  • Не пропускайте фильтрацию данных (низкокопийственные гены/клетки) перед обучением, так как это влияет на качество модели
  • Не интерпретируйте латентные представления без валидации относительно известных биологических маркеров
  • Не используйте scvi-tools для анализа объёмной РНК-секвени��ования - он специально разработан для данных одиночных клеток

Часто задаваемые вопросы

В чём разница между scVI и scanpy для анализа одиночных клеток?
scvi-tools использует глубокие генеративные модели с вариационным выводом для изучения вероятностных представлений данных одиночных клеток, обеспечивая квантификацию неопределённости и превосходную коррекцию пакетных эффектов. scanpy предоставляет традиционные методы уменьшения размерности (PCA, UMAP) и кластеризации. Используйте scvi-tools для продвинутого моделирования и коррекции пакетных эффектов, scanpy для стандартных конвейеров и последующего анализа.
Нужен ли мне GPU для использования scvi-tools?
GPU рекомендуется, но не является обязательным. Для наборов данных с менее чем 50 000 клеток обучение на CPU выполнимо. Для больших наборов данных или частого анализа ускорение на GPU значительно сокращает время обучения. Установите с поддержкой GPU: pip install scvi-tools[cuda]
Какие форматы данных поддерживает scvi-tools?
scvi-tools работает с объектами AnnData из экосистемы scanpy. Данные должны храниться в матрице .X в виде необработанных подсчётов. Коварианты на уровне клеток (пакет, донор) и информация на уровне генов регистрируются с помощью model.setup_anndata(). Поддержка объектов Seurat доступна через конверсию.
Как выбрать между scVI, scANVI и totalVI?
Используйте scVI для неконтролируемого анализа без меток типов клеток. Используйте scANVI, если у вас есть некоторые аннотации типов клеток и вы хотите полуконтролируемую интеграцию. Используйте totalVI для парных данных РНК и белков (CITE-seq) для совместного моделирования обеих модальностей.
Что возвращает метод differential_expression?
Возвращает DataFrame со статистикой на уровне генов, включая: bayes_factor (свидетельство дифференциальной экспрессии), is_de_fdr_0.05 (значимость с FDR-коррекцией), mean (средняя экспрессия на группу) и оценки размера эффекта. Более высокий bayes_factor указывает на более сильное свидетельство дифференциальной экспрессии.
Как сохранять и загружать обученные модели scvi-tools?
Используйте model.save("path/to/model", overwrite=True) для сохранения и model = scvi.model.SCVI.load("path/to/model", adata=new_adata) для загрузки. Сохранённая модель включает веса модели, историю обучения и конфигурацию. Это позволяет обмениваться моделями и избегать повторного обучения.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

BSD-3-Clause license

Ссылка

main