🧬

anndata

Name: anndata
Author: davila7

Seguro ⚙️ Comandos externos🌐 Acceso a red

Trabajar con AnnData para genómica de célulasa única

También disponible en: K-Dense-AI

El manejo de grandes matrices de datos anotados para análisis de genómica de célulasa única es complejo. Esta habilidad proporciona documentación completa para la biblioteca AnnData, permitiendo el manejo eficiente de archivos h5ad, anotaciones de metadatos e integración con el ecosistema scverse.

Soporta: Claude Codex Code(CC)

🥉 72 Bronce

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "anndata". ¿Cómo creo un objeto AnnData con anotaciones de tipo celular y metadatos de genes?

Resultado esperado:

Crear la matriz de expresión (X) con forma (observaciones, variables)
Crear DataFrame de metadatos de observación con anotaciones a nivel de célula (cell_type, sample, condition)
Crear DataFrame de metadatos de variable con información a nivel de gen (gene_name, chromosome, estado de altamente_variable)
Pasar todos los componentes al constructor ad.AnnData con parámetros X, obs y var
Acceder a las propiedades n_obs y n_vars para verificar que las dimensiones coinciden con tus metadatos

Usando "anndata". ¿Cuáles son las mejores prácticas para manejar grandes archivos AnnData?

Resultado esperado:

Usar modo backed (backed='r') para acceder a datos sin cargar la matriz completa en memoria
Convertir datos dispersos a formato de matriz dispersa (csr_matrix) para una reducción de memoria de 10-100x
Convertir columnas de texto a tipo categórico usando astype('category') o strings_to_categoricals()
Almacenar datos crudos antes de filtrar usando adata.raw = adata.copy()
Usar compression='gzip' al escribir archivos h5ad para un almacenamiento más pequeño

Auditoría de seguridad

Seguro

v5 • 1/17/2026

Documentation-only skill containing markdown reference files. No executable code, scripts, network operations, or file system access. All static findings are false positives from a pattern-matching scanner that misinterprets documentation content. Python code examples shown in markdown are illustrative only and never executed.

Archivos escaneados

2,765

Líneas analizadas

hallazgos

Auditorías totales

Factores de riesgo

⚙️ Comandos externos (349)

🌐 Acceso a red (9)

references/io_operations.md:292 references/io_operations.md:293 references/io_operations.md:83 references/io_operations.md:288 skill-report.json:6 SKILL.md:391 SKILL.md:392 SKILL.md:393 SKILL.md:394

Auditado por: claude Ver historial de auditorías →

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

100

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Flujos de trabajo de ARN-seq de célulasa única

Cargar, procesar y analizar datos de expresión génica de célulasa única usando AnnData como estructura de datos central para flujos de trabajo de scanpy

Grandes conjuntos de datos anotados

Gestionar conjuntos de datos de alta dimensionalidad con anotaciones de metadatos enriquecidos, incrustaciones y mediciones multimodales de manera eficiente

Tuberías de integración por lotes

Combinar múltiples lotes o modalidades experimentales con seguimiento adecuado de metadatos y concatenación en disco para estudios a gran escala

Prueba estos prompts

Crear objeto AnnData

¿Cómo creo un objeto AnnData desde un array de numpy y DataFrames de pandas para metadatos de observación y variable?

Leer archivos h5ad

Muéstrame cómo leer un archivo h5ad en modo backed para grandes conjuntos de datos y acceder a los metadatos de observación sin cargar la matriz completa

Concatenar lotes

¿Cómo concateno múltiples objetos AnnData de diferentes lotes experimentales mientras rastreo el origen del lote con etiquetas?

Optimizar memoria

¿Cuáles son las mejores prácticas para el manejo eficiente en memoria de grandes objetos AnnData incluyendo matrices dispersas, modo backed y tipos de datos categóricos?

Mejores prácticas

Usar matrices dispersas para datos genómicos dispersos para lograr una reducción de memoria de 10-100x
Almacenar datos crudos antes de filtrar usando adata.raw = adata.copy() para preservar el acceso a las mediciones originales
Usar modo backed (backed='r') cuando se trabaja con conjuntos de datos más grandes que la RAM disponible para evitar errores de memoria insuficiente

Evitar

Modificar vistas de AnnData sin llamar a .copy() primero puede modificar involuntariamente los datos originales
Cargar conjuntos de datos grandes completos en memoria cuando el modo backed sería suficiente causa presión de memoria innecesaria
Ignorar la alineación de índices al agregar metadatos externos puede llevar a datos desalineados y resultados incorrectos

Preguntas frecuentes

¿Qué versiones de Python son compatibles con AnnData?

AnnData soporta Python 3.9 y versiones más recientes. Consulta la documentación oficial para los últimos requisitos de compatibilidad.

¿Cuál es el tamaño máximo de archivo que AnnData puede manejar?

AnnData puede manejar archivos más grandes que la RAM cuando se usa el modo backed. Los límites prácticos dependen del espacio en disco y la compatibilidad del sistema de archivos.

¿Cómo integro AnnData con scanpy para análisis?

AnnData es el formato de datos nativo para scanpy. La mayoría de las funciones de scanpy aceptan objetos AnnData directamente y los modifican en su lugar.

¿Mis datos están seguros cuando uso el modo backed?

El modo backed es de solo lectura por defecto. Usa el modo backed='r+' para acceso de lectura y escritura que guarda los cambios directamente en el archivo.

¿Por qué mi archivo se lee lentamente?

Usa compression='gzip' al escribir, convierte texto a categóricos, y asegura que los tamaños de chunk coincidan con tus patrones de acceso para un rendimiento I/O óptimo.

¿Cómo se compara AnnData con Seurat (R) para análisis de célulasa única?

AnnData proporciona funcionalidad similar a Seurat pero en Python. Los objetos AnnData pueden convertirse usando funciones en el paquete anndata2ri para interoperabilidad.

Detalles del desarrollador

Autor

davila7

Licencia

MIT

Repositorio

https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/anndata

Ref.

main

Estructura de archivos

📁 references/

📄 best_practices.md

📄 concatenation.md

📄 data_structure.md

📄 io_operations.md

📄 manipulation.md

📄 SKILL.md