Habilidades anndata
🔬

anndata

Seguro ⚙️ Comandos externos🌐 Acceso a red

Trabajar con matrices AnnData

También disponible en: davila7

AnnData proporciona una estructura de datos estandarizada para matrices anotadas utilizada en genómica de célula única. Esta habilidad permite crear, leer, escribir y manipular archivos .h5ad con soporte completo para metadatos, embeddings y el ecosistema scverse.

Soporta: Claude Codex Code(CC)
📊 71 Adecuado
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "anndata". ¿Cómo leo un archivo H5 de 10X Genomics y lo convierto a AnnData?

Resultado esperado:

  • Usa ad.read_10x_h5() para leer el formato H5 directamente
  • La función maneja la extracción de genes y códigos de barras automáticamente
  • Parámetro genome opcional para seleccionar referencia específica cuando hay múltiples presentes

Usando "anndata". ¿Qué es el modo backed y cuándo debería usarlo?

Resultado esperado:

  • El modo backed mantiene los datos en disco y carga solo las partes accedidas
  • Úsalo para conjuntos de datos más grandes que la RAM disponible para evitar errores de memoria insuficiente
  • Accede a metadatos y crea subconjuntos sin cargar el archivo completo en memoria

Auditoría de seguridad

Seguro
v4 • 1/17/2026

All 397 static findings are FALSE POSITIVES. This skill contains only markdown documentation with Python code examples. The static scanner incorrectly flags backticks in fenced code blocks, URLs in documentation links, and generic programming terms. No executable code, network operations, or credential handling exists. This is a legitimate scientific computing documentation skill for the AnnData Python library.

7
Archivos escaneados
4,567
Líneas analizadas
2
hallazgos
4
Auditorías totales

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
21
Comunidad
100
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Análisis de RNA-seq de célula única

Procesar y cargar datos de 10X Genomics para investigación de transcriptómica de célula única con seguimiento adecuado de metadatos.

Integración de datos de múltiples lotes

Combinar múltiples lotes experimentales con seguimiento automático de etiquetas de lote y resolución de conflictos.

Integración con aprendizaje profundo

Exportar datos a PyTorch DataLoaders para entrenar redes neuronales en datos de expresión de célula única.

Prueba estos prompts

Crear objeto AnnData
Crear un objeto AnnData desde un array numpy con metadatos de observación para tipos de células e IDs de muestras.
Leer archivo H5AD
Leer un archivo H5AD en modo backed y filtrar células de alta calidad basándose en una columna quality_score.
Concatenar lotes
Concatenar tres objetos AnnData a lo largo del eje de observación con etiquetas de lote y unión interna.
Optimizar memoria
Mostrar cómo convertir columnas de cadena a categóricas y usar matrices dispersas para eficiencia de memoria.

Mejores prácticas

  • Usa el modo backed (backed='r') para conjuntos de datos más grandes que la RAM disponible para evitar errores de memoria insuficiente.
  • Convierte columnas de cadena a categóricas con strings_to_categoricals() para reducción de memoria de 10-50x.
  • Almacena datos crudos con adata.raw = adata.copy() antes de filtrar para preservar acceso a genes no filtrados.

Evitar

  • Evita modificar vistas directamente sin copiar primero, ya que los cambios pueden afectar el objeto original.
  • No cargues conjuntos de datos grandes completos en memoria cuando el modo backed puede proporcionar acceso diferido.
  • Evita desalineación de índices al agregar metadatos externos usando set_index() y loc[].join().

Preguntas frecuentes

¿Cuál es la diferencia entre el modo backed y el modo en memoria?
El modo backed mantiene los datos en disco y carga solo las partes accedidas, permitiendo trabajar con conjuntos de datos más grandes que la RAM.
¿Cómo combino múltiples objetos AnnData para diferentes modalidades como RNA y proteína?
Usa Muon (MuData) para combinar múltiples objetos AnnData para diferentes modalidades como RNA y proteína.
¿Cuándo debo usar matrices dispersas?
Usa matrices dispersas cuando los datos tienen más del 50% de ceros, común en datos de conteo de célula única.
¿Cómo rastreo de qué lote vino cada célula?
Usa los parámetros label y keys en ad.concat() para agregar una columna de lote automáticamente.
¿Para qué sirve el atributo raw?
raw almacena una instantánea de datos antes del filtrado, permitiendo acceso a genes crudos originales más tarde.
¿Cómo manejo errores de memoria insuficiente?
Usa el modo backed, convierte a matrices dispersas, convierte cadenas a categóricas, o procesa en fragmentos.

Detalles del desarrollador