Fähigkeiten anndata
🔬

anndata

Sicher ⚙️ Externe Befehle🌐 Netzwerkzugriff

Trabajar con matrices AnnData

Auch verfügbar von: davila7

AnnData proporciona una estructura de datos estandarizada para matrices anotadas utilizada en genómica de célula única. Esta habilidad permite crear, leer, escribir y manipular archivos .h5ad con soporte completo para metadatos, embeddings y el ecosistema scverse.

Unterstützt: Claude Codex Code(CC)
📊 71 Angemessen
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "anndata". ¿Cómo leo un archivo H5 de 10X Genomics y lo convierto a AnnData?

Erwartetes Ergebnis:

  • Usa ad.read_10x_h5() para leer el formato H5 directamente
  • La función maneja la extracción de genes y códigos de barras automáticamente
  • Parámetro genome opcional para seleccionar referencia específica cuando hay múltiples presentes

Verwendung von "anndata". ¿Qué es el modo backed y cuándo debería usarlo?

Erwartetes Ergebnis:

  • El modo backed mantiene los datos en disco y carga solo las partes accedidas
  • Úsalo para conjuntos de datos más grandes que la RAM disponible para evitar errores de memoria insuficiente
  • Accede a metadatos y crea subconjuntos sin cargar el archivo completo en memoria

Sicherheitsaudit

Sicher
v4 • 1/17/2026

All 397 static findings are FALSE POSITIVES. This skill contains only markdown documentation with Python code examples. The static scanner incorrectly flags backticks in fenced code blocks, URLs in documentation links, and generic programming terms. No executable code, network operations, or credential handling exists. This is a legitimate scientific computing documentation skill for the AnnData Python library.

7
Gescannte Dateien
4,567
Analysierte Zeilen
2
befunde
4
Gesamtzahl Audits
Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

45
Architektur
100
Wartbarkeit
87
Inhalt
20
Community
100
Sicherheit
91
Spezifikationskonformität

Was du bauen kannst

Análisis de RNA-seq de célula única

Procesar y cargar datos de 10X Genomics para investigación de transcriptómica de célula única con seguimiento adecuado de metadatos.

Integración de datos de múltiples lotes

Combinar múltiples lotes experimentales con seguimiento automático de etiquetas de lote y resolución de conflictos.

Integración con aprendizaje profundo

Exportar datos a PyTorch DataLoaders para entrenar redes neuronales en datos de expresión de célula única.

Probiere diese Prompts

Crear objeto AnnData
Crear un objeto AnnData desde un array numpy con metadatos de observación para tipos de células e IDs de muestras.
Leer archivo H5AD
Leer un archivo H5AD en modo backed y filtrar células de alta calidad basándose en una columna quality_score.
Concatenar lotes
Concatenar tres objetos AnnData a lo largo del eje de observación con etiquetas de lote y unión interna.
Optimizar memoria
Mostrar cómo convertir columnas de cadena a categóricas y usar matrices dispersas para eficiencia de memoria.

Bewährte Verfahren

  • Usa el modo backed (backed='r') para conjuntos de datos más grandes que la RAM disponible para evitar errores de memoria insuficiente.
  • Convierte columnas de cadena a categóricas con strings_to_categoricals() para reducción de memoria de 10-50x.
  • Almacena datos crudos con adata.raw = adata.copy() antes de filtrar para preservar acceso a genes no filtrados.

Vermeiden

  • Evita modificar vistas directamente sin copiar primero, ya que los cambios pueden afectar el objeto original.
  • No cargues conjuntos de datos grandes completos en memoria cuando el modo backed puede proporcionar acceso diferido.
  • Evita desalineación de índices al agregar metadatos externos usando set_index() y loc[].join().

Häufig gestellte Fragen

¿Cuál es la diferencia entre el modo backed y el modo en memoria?
El modo backed mantiene los datos en disco y carga solo las partes accedidas, permitiendo trabajar con conjuntos de datos más grandes que la RAM.
¿Cómo combino múltiples objetos AnnData para diferentes modalidades como RNA y proteína?
Usa Muon (MuData) para combinar múltiples objetos AnnData para diferentes modalidades como RNA y proteína.
¿Cuándo debo usar matrices dispersas?
Usa matrices dispersas cuando los datos tienen más del 50% de ceros, común en datos de conteo de célula única.
¿Cómo rastreo de qué lote vino cada célula?
Usa los parámetros label y keys en ad.concat() para agregar una columna de lote automáticamente.
¿Para qué sirve el atributo raw?
raw almacena una instantánea de datos antes del filtrado, permitiendo acceso a genes crudos originales más tarde.
¿Cómo manejo errores de memoria insuficiente?
Usa el modo backed, convierte a matrices dispersas, convierte cadenas a categóricas, o procesa en fragmentos.