anndata
Travailler avec AnnData pour la génomique monocellulaire
Também disponível em: K-Dense-AI
La gestion de grandes matrices de données annotées pour l'analyse en génomique monocellulaire est complexe. Cette compétence fournit une documentation complète sur la bibliothèque AnnData, permettant une gestion efficace des fichiers h5ad, des annotations de métadonnées et de l'intégration avec l'écosystème scverse.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "anndata". How do I create an AnnData object with cell type annotations and gene metadata?
Resultado esperado:
- Créer la matrice d'expression (X) avec la forme (observations, variables)
- Créer un DataFrame de métadonnées d'observation avec des annotations au niveau des cellules (cell_type, sample, condition)
- Créer un DataFrame de métadonnées de variables avec des informations au niveau des gènes (gene_name, chromosome, highly_variable status)
- Passer tous les composants au constructeur ad.AnnData avec les paramètres X, obs et var
- Accéder aux propriétés n_obs et n_vars pour vérifier que les dimensions correspondent à vos métadonnées
A utilizar "anndata". What are the best practices for handling large AnnData files?
Resultado esperado:
- Utiliser le mode backed (backed='r') pour accéder aux données sans charger toute la matrice en mémoire
- Convertir les données clairsemées en format de matrice creuse (csr_matrix) pour une réduction mémoire de 10 à 100x
- Convertir les colonnes de chaînes en type catégoriel avec astype('category') ou strings_to_categoricals()
- Stocker les données brutes avant filtrage avec adata.raw = adata.copy()
- Utiliser compression='gzip' lors de l'écriture de fichiers h5ad pour un stockage plus compact
Auditoria de Segurança
SeguroDocumentation-only skill containing markdown reference files. No executable code, scripts, network operations, or file system access. All static findings are false positives from a pattern-matching scanner that misinterprets documentation content. Python code examples shown in markdown are illustrative only and never executed.
Fatores de risco
⚙️ Comandos externos (349)
Pontuação de qualidade
O Que Você Pode Construir
Workflows RNA-seq monocellulaires
Charger, traiter et analyser des données d'expression génique monocellulaire en utilisant AnnData comme structure de données centrale pour les workflows scanpy
Grands ensembles de données annotées
Gérer efficacement des ensembles de données à haute dimension avec des annotations de métadonnées riches, des embeddings et des mesures multi-modales
Pipelines d'intégration de lots
Combiner plusieurs lots expérimentaux ou modalités avec un suivi approprié des métadonnées et une concaténation sur disque pour des études à grande échelle
Tente Estes Prompts
Comment créer un objet AnnData à partir d'un tableau numpy et de DataFrames pandas pour les métadonnées d'observations et de variables ?
Montrez-moi comment lire un fichier h5ad en mode backed pour de grands jeux de données et accéder aux métadonnées d'observation sans charger la matrice complète
Comment concaténer plusieurs objets AnnData provenant de différents lots expérimentaux tout en suivant la source du lot avec des étiquettes ?
Quelles sont les meilleures pratiques pour une gestion efficace en mémoire de grands objets AnnData, y compris les matrices creuses, le mode backed et les types de données catégoriels ?
Melhores Práticas
- Utiliser des matrices creuses pour des données génomiques clairsemées afin d'obtenir une réduction mémoire de 10 à 100x
- Stocker les données brutes avant filtrage en utilisant adata.raw = adata.copy() pour préserver l'accès aux mesures originales
- Utiliser le mode backed (backed='r') lorsque vous travaillez avec des jeux de données plus grands que la RAM disponible afin d'éviter les erreurs de mémoire insuffisante
Evitar
- Modifier des vues AnnData sans appeler .copy() au préalable peut modifier involontairement les données d'origine
- Charger entièrement de grands jeux de données en mémoire alors que le mode backed suffirait provoque une pression mémoire inutile
- Ignorer l'alignement des index lors de l'ajout de métadonnées externes peut entraîner des données désalignées et des résultats incorrects
Perguntas Frequentes
Quelles versions de Python sont prises en charge par AnnData ?
Quelle est la taille maximale de fichier qu'AnnData peut gérer ?
Comment intégrer AnnData avec scanpy pour l'analyse ?
Mes données sont-elles en sécurité lors de l'utilisation du mode backed ?
Pourquoi la lecture de mon fichier est-elle lente ?
Comment AnnData se compare-t-il à Seurat (R) pour l'analyse monocellulaire ?
Detalhes do Desenvolvedor
Autor
davila7Licença
MIT
Repositório
https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/anndataReferência
main
Estrutura de arquivos