cellxgene-census
Interroger les données CELLxGENE Census
Également disponible depuis: davila7
Les chercheurs ont besoin d'accéder à des données génomiques unicellulaires à grande échelle pour la recherche sur les maladies et la découverte de médicaments. Cette compétence fournit un accès programmatique à 61 millions de cellules du CELLxGENE Census, permettant des requêtes à l'échelle de la population sans télécharger des ensembles de données entiers.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "cellxgene-census". Trouver toutes les cellules T dans le tissu pulmonaire de patients COVID-19
Résultat attendu:
- 45 230 cellules trouvées correspondant aux critères :
- Types cellulaires : cellule T CD4-positive (18 200), cellule T CD8-positive (12 450), cellule T régulatrice (8 230), cellule NK T (6 350)
- Ensembles de données : 12 ensembles de données ont contribué
- Principaux tissus : poumon (45 230), ganglion lymphatique (12 100), rate (8 450)
Utilisation de "cellxgene-census". Quels gènes sont exprimés dans les neurones ?
Résultat attendu:
- La requête a retourné 2,1 millions de cellules neuronales à travers 245 ensembles de données
- Gènes les plus exprimés (expression moyenne) :
- - SNAP25: 8.4
- - SYP: 7.2
- - MAP2: 6.8
- - NEUROD1: 5.9
- - ELavl3: 5.4
Audit de sécurité
Risque faibleAll 228 static findings are FALSE POSITIVEs. The scanner detected patterns in markdown documentation that are not actual security vulnerabilities. External command detections are backticks in code blocks. C2 keyword detections are the substring 'C2' in 'CELLxGENE'. Cryptographic algorithm detections are documentation patterns. System reconnaissance detections are the word 'reconnaissance' in documentation text. The skill is safe for publication.
Facteurs de risque
🌐 Accès réseau (1)
Score de qualité
Ce que vous pouvez construire
Explorer les types cellulaires dans un tissu
Interroger le Census pour découvrir tous les types cellulaires présents dans un tissu spécifique, tel que le cerveau ou le poumon, ainsi que les fréquences des types cellulaires.
Analyser les marqueurs d'expression génique
Interroger les niveaux d'expression de gènes spécifiques (CD4, CD8A, FOXP3) à travers les types cellulaires et les maladies pour identifier les gènes marqueurs.
Entraîner des classificateurs de types cellulaires
Utiliser les données Census avec PyTorch pour entraîner des modèles d'apprentissage automatique pour les tâches de classification de types cellulaires.
Essayez ces prompts
Trouver toutes les cellules de type [CELL_TYPE] dans le tissu [TISSUE] du CELLxGENE Census. Retourner le nombre de cellules et les métadonnées.
Interroger l'expression génique pour [GENE1], [GENE2] et [GENE3] à travers tous les types cellulaires dans l'ensemble de données [DISEASE]. Montrer les profils d'expression.
Comparer les cellules [CELL_TYPE] à travers les tissus [TISSUE1], [TISSUE2] et [TISSUE3]. Quels gènes sont exprimés différentiellement ?
Créer un ensemble de données d'entraînement à partir du Census pour la classification [CELL_TYPE]. Inclure les métadonnées [COLUMNS] et les données d'expression génique.
Bonnes pratiques
- Toujours filtrer pour is_primary_data == True afin d'éviter les cellules dupliquées dans les résultats
- Spécifier census_version explicitement pour une recherche reproductible
- Estimer la taille de la requête avant de charger de grands ensembles de données pour éviter les problèmes de mémoire
Éviter
- Ne pas effectuer de requête sans filtres - toujours spécifier des critères de tissu, type cellulaire ou maladie
- Ne pas charger toutes les données Census en une seule fois - utiliser des filtres et une sélection de colonnes pour réduire le transfert de données
- Ne pas ignorer le flag is_primary_data - il empêche le comptage de cellules dupliquées
Foire aux questions
Qu'est-ce que le CELLxGENE Census ?
En quoi cela diffère-t-il de scanpy ou scvi-tools ?
Quels organismes sont disponibles ?
Comment filtrer les requêtes efficacement ?
Que faire si ma requête est trop volumineuse pour la mémoire ?
Comment garantir des résultats reproductibles ?
Détails du développeur
Auteur
K-Dense-AILicence
Unknown
Dépôt
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/cellxgene-censusRéf
main
Structure de fichiers