cellxgene-census
Запрос данных CELLxGENE Census
Также доступно от: davila7
Исследователям необходим доступ к крупномасштабным данным геномики одиночных клеток для исследования заболеваний и разработки лекарств. Этот навык обеспечивает программный доступ к 61 миллиону клеток из CELLxGENE Census, позволяя выполнять запросы популяционного масштаба без загрузки целых наборов данных.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «cellxgene-census». Найти все T-клетки в легочной ткани пациентов с COVID-19
Ожидаемый результат:
- Найдено 45,230 клеток, соответствующих критериям:
- Типы клеток: CD4-позитивная T-клетка (18,200), CD8-позитивная T-клетка (12,450), регуляторная T-клетка (8,230), NK T-клетка (6,350)
- Наборы данных: 12 наборов данных предоставили данные
- Основные ткани: легкое (45,230), лимфатический узел (12,100), селезенка (8,450)
Использование «cellxgene-census». Какие гены экспрессируются в нейронах?
Ожидаемый результат:
- Запрос вернул 2.1M нейронных клеток из 245 наборов данных
- Наиболее экспрессируемые гены (средняя экспрессия):
- - SNAP25: 8.4
- - SYP: 7.2
- - MAP2: 6.8
- - NEUROD1: 5.9
- - ELavl3: 5.4
Аудит безопасности
Низкий рискAll 228 static findings are FALSE POSITIVEs. The scanner detected patterns in markdown documentation that are not actual security vulnerabilities. External command detections are backticks in code blocks. C2 keyword detections are the substring 'C2' in 'CELLxGENE'. Cryptographic algorithm detections are documentation patterns. System reconnaissance detections are the word 'reconnaissance' in documentation text. The skill is safe for publication.
Факторы риска
🌐 Доступ к сети (1)
Оценка качества
Что вы можете построить
Исследование типов клеток в ткани
Запрос Census для обнаружения всех типов клеток, присутствующих в конкретной ткани, такой как мозг или легкие, вместе с частотой типов клеток.
Анализ маркеров экспрессии генов
Запрос уровней экспрессии конкретных генов (CD4, CD8A, FOXP3) по типам клеток и заболеваниям для идентификации маркерных генов.
Обучение классификаторов типов клеток
Использование данных Census с PyTorch для обучения моделей машинного обучения для задач классификации типов клеток.
Попробуйте эти промпты
Найти все клетки типа [CELL_TYPE] в ткани [TISSUE] из CELLxGENE Census. Вернуть количество клеток и метаданные.
Запросить экспрессию генов для [GENE1], [GENE2] и [GENE3] по всем типам клеток в наборе данных [DISEASE]. Показать паттерны экспрессии.
Сравнить клетки [CELL_TYPE] в тканях [TISSUE1], [TISSUE2] и [TISSUE3]. Какие гены дифференциально экспрессированы?
Создать обучающий набор данных из Census для классификации [CELL_TYPE]. Включить метаданные [COLUMNS] и данные экспрессии генов.
Лучшие практики
- Всегда фильтруйте по is_primary_data == True, чтобы избежать дублирования клеток в результатах
- Явно указывайте census_version для воспроизводимых исследований
- Оценивайте размер запроса перед загрузкой больших наборов данных, чтобы предотвратить проблемы с памятью
Избегать
- Не выполняйте запросы без фильтров - всегда указывайте критерии ткани, типа клетки или заболевания
- Не загружайте все данные Census за один раз - используйте фильтры и выбор столбцов для сокращения передачи данных
- Не игнорируйте флаг is_primary_data - он предотвращает подсчет дублирующихся клеток
Часто задаваемые вопросы
Что такое CELLxGENE Census?
Чем это отличается от scanpy или scvi-tools?
Какие организмы доступны?
Как эффективно фильтровать запросы?
Что делать, если мой запрос слишком велик для памяти?
Как обеспечить воспроизводимость результатов?
Сведения для разработчиков
Автор
K-Dense-AIЛицензия
Unknown
Репозиторий
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/cellxgene-censusСсылка
main
Структура файлов