Compétences cellxgene-census
🧬

cellxgene-census

Risque faible 🌐 Accès réseau

Interroger les données CELLxGENE Census

Également disponible depuis: davila7

Les chercheurs ont besoin d'accéder à des données génomiques unicellulaires à grande échelle pour la recherche sur les maladies et la découverte de médicaments. Cette compétence fournit un accès programmatique à 61 millions de cellules du CELLxGENE Census, permettant des requêtes à l'échelle de la population sans télécharger des ensembles de données entiers.

Prend en charge: Claude Codex Code(CC)
⚠️ 67 Médiocre
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "cellxgene-census". Trouver toutes les cellules T dans le tissu pulmonaire de patients COVID-19

Résultat attendu:

  • 45 230 cellules trouvées correspondant aux critères :
  • Types cellulaires : cellule T CD4-positive (18 200), cellule T CD8-positive (12 450), cellule T régulatrice (8 230), cellule NK T (6 350)
  • Ensembles de données : 12 ensembles de données ont contribué
  • Principaux tissus : poumon (45 230), ganglion lymphatique (12 100), rate (8 450)

Utilisation de "cellxgene-census". Quels gènes sont exprimés dans les neurones ?

Résultat attendu:

  • La requête a retourné 2,1 millions de cellules neuronales à travers 245 ensembles de données
  • Gènes les plus exprimés (expression moyenne) :
  • - SNAP25: 8.4
  • - SYP: 7.2
  • - MAP2: 6.8
  • - NEUROD1: 5.9
  • - ELavl3: 5.4

Audit de sécurité

Risque faible
v5 • 1/21/2026

All 228 static findings are FALSE POSITIVEs. The scanner detected patterns in markdown documentation that are not actual security vulnerabilities. External command detections are backticks in code blocks. C2 keyword detections are the substring 'C2' in 'CELLxGENE'. Cryptographic algorithm detections are documentation patterns. System reconnaissance detections are the word 'reconnaissance' in documentation text. The skill is safe for publication.

4
Fichiers analysés
3,343
Lignes analysées
1
résultats
5
Total des audits

Facteurs de risque

🌐 Accès réseau (1)

Score de qualité

41
Architecture
90
Maintenabilité
87
Contenu
21
Communauté
90
Sécurité
87
Conformité aux spécifications

Ce que vous pouvez construire

Explorer les types cellulaires dans un tissu

Interroger le Census pour découvrir tous les types cellulaires présents dans un tissu spécifique, tel que le cerveau ou le poumon, ainsi que les fréquences des types cellulaires.

Analyser les marqueurs d'expression génique

Interroger les niveaux d'expression de gènes spécifiques (CD4, CD8A, FOXP3) à travers les types cellulaires et les maladies pour identifier les gènes marqueurs.

Entraîner des classificateurs de types cellulaires

Utiliser les données Census avec PyTorch pour entraîner des modèles d'apprentissage automatique pour les tâches de classification de types cellulaires.

Essayez ces prompts

Requête cellulaire de base
Trouver toutes les cellules de type [CELL_TYPE] dans le tissu [TISSUE] du CELLxGENE Census. Retourner le nombre de cellules et les métadonnées.
Analyse d'expression multi-gènes
Interroger l'expression génique pour [GENE1], [GENE2] et [GENE3] à travers tous les types cellulaires dans l'ensemble de données [DISEASE]. Montrer les profils d'expression.
Comparaison inter-tissus
Comparer les cellules [CELL_TYPE] à travers les tissus [TISSUE1], [TISSUE2] et [TISSUE3]. Quels gènes sont exprimés différentiellement ?
Création d'ensemble de données d'apprentissage automatique
Créer un ensemble de données d'entraînement à partir du Census pour la classification [CELL_TYPE]. Inclure les métadonnées [COLUMNS] et les données d'expression génique.

Bonnes pratiques

  • Toujours filtrer pour is_primary_data == True afin d'éviter les cellules dupliquées dans les résultats
  • Spécifier census_version explicitement pour une recherche reproductible
  • Estimer la taille de la requête avant de charger de grands ensembles de données pour éviter les problèmes de mémoire

Éviter

  • Ne pas effectuer de requête sans filtres - toujours spécifier des critères de tissu, type cellulaire ou maladie
  • Ne pas charger toutes les données Census en une seule fois - utiliser des filtres et une sélection de colonnes pour réduire le transfert de données
  • Ne pas ignorer le flag is_primary_data - il empêche le comptage de cellules dupliquées

Foire aux questions

Qu'est-ce que le CELLxGENE Census ?
Le CELLxGENE Census est une collection standardisée et versionnée de données génomiques unicellulaires contenant plus de 61 millions de cellules humaines et murines. Il fournit un accès programmatique aux matrices d'expression génique, aux métadonnées et aux embeddings.
En quoi cela diffère-t-il de scanpy ou scvi-tools ?
Cette compétence interroge des données Census externes. Utilisez scanpy ou scvi-tools lors de l'analyse de vos propres ensembles de données locaux. Le Census est idéal pour les comparaisons d'atlas de référence et les requêtes à l'échelle de la population.
Quels organismes sont disponibles ?
Le Census contient des données de Homo sapiens (humain) et Mus musculus (souris). Interrogez en utilisant organism='Homo sapiens' ou organism='Mus musculus'.
Comment filtrer les requêtes efficacement ?
Utilisez obs_value_filter pour les métadonnées de cellules et var_value_filter pour les métadonnées de gènes. Combinez les conditions avec 'and' ou 'or'. Utilisez 'in' pour plusieurs valeurs.
Que faire si ma requête est trop volumineuse pour la mémoire ?
Utilisez la méthode axis_query() avec un traitement itératif par lots. Cela permet un traitement hors mémoire pour les requêtes dépassant la RAM disponible.
Comment garantir des résultats reproductibles ?
Spécifiez toujours le paramètre census_version lors de l'ouverture du Census, tel que census_version='2023-07-25'. Cela verrouille votre analyse sur une version spécifique des données.

Détails du développeur

Structure de fichiers