Навыки cellxgene-census
🧬

cellxgene-census

Низкий риск 🌐 Доступ к сети

Запрос данных CELLxGENE Census

Также доступно от: davila7

Исследователям необходим доступ к крупномасштабным данным геномики одиночных клеток для исследования заболеваний и разработки лекарств. Этот навык обеспечивает программный доступ к 61 миллиону клеток из CELLxGENE Census, позволяя выполнять запросы популяционного масштаба без загрузки целых наборов данных.

Поддерживает: Claude Codex Code(CC)
⚠️ 67 Плохо
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «cellxgene-census». Найти все T-клетки в легочной ткани пациентов с COVID-19

Ожидаемый результат:

  • Найдено 45,230 клеток, соответствующих критериям:
  • Типы клеток: CD4-позитивная T-клетка (18,200), CD8-позитивная T-клетка (12,450), регуляторная T-клетка (8,230), NK T-клетка (6,350)
  • Наборы данных: 12 наборов данных предоставили данные
  • Основные ткани: легкое (45,230), лимфатический узел (12,100), селезенка (8,450)

Использование «cellxgene-census». Какие гены экспрессируются в нейронах?

Ожидаемый результат:

  • Запрос вернул 2.1M нейронных клеток из 245 наборов данных
  • Наиболее экспрессируемые гены (средняя экспрессия):
  • - SNAP25: 8.4
  • - SYP: 7.2
  • - MAP2: 6.8
  • - NEUROD1: 5.9
  • - ELavl3: 5.4

Аудит безопасности

Низкий риск
v5 • 1/21/2026

All 228 static findings are FALSE POSITIVEs. The scanner detected patterns in markdown documentation that are not actual security vulnerabilities. External command detections are backticks in code blocks. C2 keyword detections are the substring 'C2' in 'CELLxGENE'. Cryptographic algorithm detections are documentation patterns. System reconnaissance detections are the word 'reconnaissance' in documentation text. The skill is safe for publication.

4
Просканировано файлов
3,343
Проанализировано строк
1
находки
5
Всего аудитов

Факторы риска

🌐 Доступ к сети (1)

Оценка качества

41
Архитектура
90
Сопровождаемость
87
Контент
21
Сообщество
90
Безопасность
87
Соответствие спецификации

Что вы можете построить

Исследование типов клеток в ткани

Запрос Census для обнаружения всех типов клеток, присутствующих в конкретной ткани, такой как мозг или легкие, вместе с частотой типов клеток.

Анализ маркеров экспрессии генов

Запрос уровней экспрессии конкретных генов (CD4, CD8A, FOXP3) по типам клеток и заболеваниям для идентификации маркерных генов.

Обучение классификаторов типов клеток

Использование данных Census с PyTorch для обучения моделей машинного обучения для задач классификации типов клеток.

Попробуйте эти промпты

Базовый запрос клеток
Найти все клетки типа [CELL_TYPE] в ткани [TISSUE] из CELLxGENE Census. Вернуть количество клеток и метаданные.
Анализ экспрессии нескольких генов
Запросить экспрессию генов для [GENE1], [GENE2] и [GENE3] по всем типам клеток в наборе данных [DISEASE]. Показать паттерны экспрессии.
Сравнение между тканями
Сравнить клетки [CELL_TYPE] в тканях [TISSUE1], [TISSUE2] и [TISSUE3]. Какие гены дифференциально экспрессированы?
Создание набора данных для машинного обучения
Создать обучающий набор данных из Census для классификации [CELL_TYPE]. Включить метаданные [COLUMNS] и данные экспрессии генов.

Лучшие практики

  • Всегда фильтруйте по is_primary_data == True, чтобы избежать дублирования клеток в результатах
  • Явно указывайте census_version для воспроизводимых исследований
  • Оценивайте размер запроса перед загрузкой больших наборов данных, чтобы предотвратить проблемы с памятью

Избегать

  • Не выполняйте запросы без фильтров - всегда указывайте критерии ткани, типа клетки или заболевания
  • Не загружайте все данные Census за один раз - используйте фильтры и выбор столбцов для сокращения передачи данных
  • Не игнорируйте флаг is_primary_data - он предотвращает подсчет дублирующихся клеток

Часто задаваемые вопросы

Что такое CELLxGENE Census?
CELLxGENE Census - это стандартизированная версионная коллекция данных геномики одиночных клеток, содержащая более 61 миллиона клеток человека и мыши. Он обеспечивает программный доступ к матрицам экспрессии генов, метаданным и векторным представлениям.
Чем это отличается от scanpy или scvi-tools?
Этот навык запрашивает внешние данные Census. Используйте scanpy или scvi-tools при анализе ваших собственных локальных наборов данных. Census идеален для сравнений с эталонными атласами и запросов популяционного масштаба.
Какие организмы доступны?
Census содержит данные от Homo sapiens (человека) и Mus musculus (мыши). Запрашивайте, используя organism='Homo sapiens' или organism='Mus musculus'.
Как эффективно фильтровать запросы?
Используйте obs_value_filter для метаданных клеток и var_value_filter для метаданных генов. Объединяйте условия с помощью 'and' или 'or'. Используйте 'in' для нескольких значений.
Что делать, если мой запрос слишком велик для памяти?
Используйте метод axis_query() с итеративной пакетной обработкой. Это обеспечивает внеядерную обработку для запросов, превышающих доступную оперативную память.
Как обеспечить воспроизводимость результатов?
Всегда указывайте параметр census_version при открытии Census, например census_version='2023-07-25'. Это привязывает ваш анализ к конкретному релизу данных.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

Unknown

Ссылка

main

Структура файлов