🔬

anndata

Name: anndata
Author: K-Dense-AI

Sicher ⚙️ Externe Befehle🌐 Netzwerkzugriff

Trabajar con matrices AnnData

Auch verfügbar von: davila7

AnnData proporciona una estructura de datos estandarizada para matrices anotadas utilizada en genómica de célula única. Esta habilidad permite crear, leer, escribir y manipular archivos .h5ad con soporte completo para metadatos, embeddings y el ecosistema scverse.

Unterstützt: Claude Codex Code(CC)

📊 71 Angemessen

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "anndata". ¿Cómo leo un archivo H5 de 10X Genomics y lo convierto a AnnData?

Erwartetes Ergebnis:

Usa ad.read_10x_h5() para leer el formato H5 directamente
La función maneja la extracción de genes y códigos de barras automáticamente
Parámetro genome opcional para seleccionar referencia específica cuando hay múltiples presentes

Verwendung von "anndata". ¿Qué es el modo backed y cuándo debería usarlo?

Erwartetes Ergebnis:

El modo backed mantiene los datos en disco y carga solo las partes accedidas
Úsalo para conjuntos de datos más grandes que la RAM disponible para evitar errores de memoria insuficiente
Accede a metadatos y crea subconjuntos sin cargar el archivo completo en memoria

Sicherheitsaudit

Sicher

v4 • 1/17/2026

All 397 static findings are FALSE POSITIVES. This skill contains only markdown documentation with Python code examples. The static scanner incorrectly flags backticks in fenced code blocks, URLs in documentation links, and generic programming terms. No executable code, network operations, or credential handling exists. This is a legitimate scientific computing documentation skill for the AnnData Python library.

Gescannte Dateien

4,567

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (2)

references/best_practices.md:1-526 SKILL.md:1-399

🌐 Netzwerkzugriff (2)

SKILL.md:394-397 references/io_operations.md:283-295

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Análisis de RNA-seq de célula única

Procesar y cargar datos de 10X Genomics para investigación de transcriptómica de célula única con seguimiento adecuado de metadatos.

Integración de datos de múltiples lotes

Combinar múltiples lotes experimentales con seguimiento automático de etiquetas de lote y resolución de conflictos.

Integración con aprendizaje profundo

Exportar datos a PyTorch DataLoaders para entrenar redes neuronales en datos de expresión de célula única.

Probiere diese Prompts

Crear objeto AnnData

Crear un objeto AnnData desde un array numpy con metadatos de observación para tipos de células e IDs de muestras.

Leer archivo H5AD

Leer un archivo H5AD en modo backed y filtrar células de alta calidad basándose en una columna quality_score.

Concatenar lotes

Concatenar tres objetos AnnData a lo largo del eje de observación con etiquetas de lote y unión interna.

Optimizar memoria

Mostrar cómo convertir columnas de cadena a categóricas y usar matrices dispersas para eficiencia de memoria.

Bewährte Verfahren

Usa el modo backed (backed='r') para conjuntos de datos más grandes que la RAM disponible para evitar errores de memoria insuficiente.
Convierte columnas de cadena a categóricas con strings_to_categoricals() para reducción de memoria de 10-50x.
Almacena datos crudos con adata.raw = adata.copy() antes de filtrar para preservar acceso a genes no filtrados.

Vermeiden

Evita modificar vistas directamente sin copiar primero, ya que los cambios pueden afectar el objeto original.
No cargues conjuntos de datos grandes completos en memoria cuando el modo backed puede proporcionar acceso diferido.
Evita desalineación de índices al agregar metadatos externos usando set_index() y loc[].join().

Häufig gestellte Fragen

¿Cuál es la diferencia entre el modo backed y el modo en memoria?

El modo backed mantiene los datos en disco y carga solo las partes accedidas, permitiendo trabajar con conjuntos de datos más grandes que la RAM.

¿Cómo combino múltiples objetos AnnData para diferentes modalidades como RNA y proteína?

Usa Muon (MuData) para combinar múltiples objetos AnnData para diferentes modalidades como RNA y proteína.

¿Cuándo debo usar matrices dispersas?

Usa matrices dispersas cuando los datos tienen más del 50% de ceros, común en datos de conteo de célula única.

¿Cómo rastreo de qué lote vino cada célula?

Usa los parámetros label y keys en ad.concat() para agregar una columna de lote automáticamente.

¿Para qué sirve el atributo raw?

raw almacena una instantánea de datos antes del filtrado, permitiendo acceso a genes crudos originales más tarde.

¿Cómo manejo errores de memoria insuficiente?

Usa el modo backed, convierte a matrices dispersas, convierte cadenas a categóricas, o procesa en fragmentos.

Entwicklerdetails

Autor

K-Dense-AI

Lizenz

BSD-3-Clause license

Repository

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/anndata

Ref

main

Dateistruktur

📁 references/

📄 best_practices.md

📄 concatenation.md

📄 data_structure.md

📄 io_operations.md

📄 manipulation.md

📄 SKILL.md