🧬

anndata

Name: anndata
Author: davila7

Sûr ⚙️ Commandes externes🌐 Accès réseau

Travailler avec AnnData pour la génomique monocellulaire

Également disponible depuis: K-Dense-AI

La gestion de grandes matrices de données annotées pour l'analyse en génomique monocellulaire est complexe. Cette compétence fournit une documentation complète sur la bibliothèque AnnData, permettant une gestion efficace des fichiers h5ad, des annotations de métadonnées et de l'intégration avec l'écosystème scverse.

Prend en charge: Claude Codex Code(CC)

🥉 72 Bronze

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "anndata". How do I create an AnnData object with cell type annotations and gene metadata?

Résultat attendu:

Créer la matrice d'expression (X) avec la forme (observations, variables)
Créer un DataFrame de métadonnées d'observation avec des annotations au niveau des cellules (cell_type, sample, condition)
Créer un DataFrame de métadonnées de variables avec des informations au niveau des gènes (gene_name, chromosome, highly_variable status)
Passer tous les composants au constructeur ad.AnnData avec les paramètres X, obs et var
Accéder aux propriétés n_obs et n_vars pour vérifier que les dimensions correspondent à vos métadonnées

Utilisation de "anndata". What are the best practices for handling large AnnData files?

Résultat attendu:

Utiliser le mode backed (backed='r') pour accéder aux données sans charger toute la matrice en mémoire
Convertir les données clairsemées en format de matrice creuse (csr_matrix) pour une réduction mémoire de 10 à 100x
Convertir les colonnes de chaînes en type catégoriel avec astype('category') ou strings_to_categoricals()
Stocker les données brutes avant filtrage avec adata.raw = adata.copy()
Utiliser compression='gzip' lors de l'écriture de fichiers h5ad pour un stockage plus compact

Audit de sécurité

Sûr

v5 • 1/17/2026

Documentation-only skill containing markdown reference files. No executable code, scripts, network operations, or file system access. All static findings are false positives from a pattern-matching scanner that misinterprets documentation content. Python code examples shown in markdown are illustrative only and never executed.

Fichiers analysés

2,765

Lignes analysées

résultats

Total des audits

Facteurs de risque

⚙️ Commandes externes (349)

🌐 Accès réseau (9)

references/io_operations.md:292 references/io_operations.md:293 references/io_operations.md:83 references/io_operations.md:288 skill-report.json:6 SKILL.md:391 SKILL.md:392 SKILL.md:393 SKILL.md:394

Audité par: claude Voir l’historique des audits →

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Workflows RNA-seq monocellulaires

Charger, traiter et analyser des données d'expression génique monocellulaire en utilisant AnnData comme structure de données centrale pour les workflows scanpy

Grands ensembles de données annotées

Gérer efficacement des ensembles de données à haute dimension avec des annotations de métadonnées riches, des embeddings et des mesures multi-modales

Pipelines d'intégration de lots

Combiner plusieurs lots expérimentaux ou modalités avec un suivi approprié des métadonnées et une concaténation sur disque pour des études à grande échelle

Essayez ces prompts

Créer un objet AnnData

Comment créer un objet AnnData à partir d'un tableau numpy et de DataFrames pandas pour les métadonnées d'observations et de variables ?

Lire des fichiers h5ad

Montrez-moi comment lire un fichier h5ad en mode backed pour de grands jeux de données et accéder aux métadonnées d'observation sans charger la matrice complète

Concaténer des lots

Comment concaténer plusieurs objets AnnData provenant de différents lots expérimentaux tout en suivant la source du lot avec des étiquettes ?

Optimiser la mémoire

Quelles sont les meilleures pratiques pour une gestion efficace en mémoire de grands objets AnnData, y compris les matrices creuses, le mode backed et les types de données catégoriels ?

Bonnes pratiques

Utiliser des matrices creuses pour des données génomiques clairsemées afin d'obtenir une réduction mémoire de 10 à 100x
Stocker les données brutes avant filtrage en utilisant adata.raw = adata.copy() pour préserver l'accès aux mesures originales
Utiliser le mode backed (backed='r') lorsque vous travaillez avec des jeux de données plus grands que la RAM disponible afin d'éviter les erreurs de mémoire insuffisante

Éviter

Modifier des vues AnnData sans appeler .copy() au préalable peut modifier involontairement les données d'origine
Charger entièrement de grands jeux de données en mémoire alors que le mode backed suffirait provoque une pression mémoire inutile
Ignorer l'alignement des index lors de l'ajout de métadonnées externes peut entraîner des données désalignées et des résultats incorrects

Foire aux questions

Quelles versions de Python sont prises en charge par AnnData ?

AnnData prend en charge Python 3.9 et versions ultérieures. Consultez la documentation officielle pour les dernières exigences de compatibilité.

Quelle est la taille maximale de fichier qu'AnnData peut gérer ?

AnnData peut gérer des fichiers plus grands que la RAM en utilisant le mode backed. Les limites pratiques dépendent de l'espace disque et du support du système de fichiers.

Comment intégrer AnnData avec scanpy pour l'analyse ?

AnnData est le format de données natif pour scanpy. La plupart des fonctions scanpy acceptent directement des objets AnnData et les modifient sur place.

Mes données sont-elles en sécurité lors de l'utilisation du mode backed ?

Le mode backed est en lecture seule par défaut. Utilisez le mode backed='r+' pour un accès en lecture-écriture qui enregistre les modifications directement dans le fichier.

Pourquoi la lecture de mon fichier est-elle lente ?

Utilisez compression='gzip' lors de l'écriture, convertissez les chaînes en catégories et assurez-vous que les tailles de chunks correspondent à vos schémas d'accès pour des performances d'E/S optimales.

Comment AnnData se compare-t-il à Seurat (R) pour l'analyse monocellulaire ?

AnnData offre une fonctionnalité similaire à Seurat mais en Python. Les objets AnnData peuvent être convertis à l'aide des fonctions du package anndata2ri pour l'interopérabilité.

Détails du développeur

Auteur

davila7

Licence

MIT

Dépôt

https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/anndata

Réf

main

Structure de fichiers

📁 references/

📄 best_practices.md

📄 concatenation.md

📄 data_structure.md

📄 io_operations.md

📄 manipulation.md

📄 SKILL.md