🔬

anndata

Name: anndata
Author: K-Dense-AI

Seguro ⚙️ Comandos externos🌐 Acesso à rede

Trabalhar com matrizes AnnData

Também disponível em: davila7

AnnData fornece uma estrutura de dados padronizada para matrizes anotadas usadas em genômica de célula única. Esta habilidade permite criar, ler, escrever e manipular arquivos .h5ad com suporte completo para metadados, embeddings e o ecossistema scverse.

Suporta: Claude Codex Code(CC)

📊 71 Adequado

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "anndata". Como faço para ler um arquivo H5 do 10X Genomics e convertê-lo para AnnData?

Resultado esperado:

Use ad.read_10x_h5() para ler o formato H5 diretamente
A função lida com extração de genes e códigos de barras automaticamente
Parâmetro genome opcional para selecionar referência específica quando houver múltiplas

A utilizar "anndata". O que é modo backed e quando devo usá-lo?

Resultado esperado:

O modo backed mantém os dados em disco e carrega apenas as partes acessadas
Use-o para conjuntos de dados maiores que a RAM disponível para evitar erros de falta de memória
Acesse metadados e crie subconjuntos sem carregar o arquivo inteiro na memória

Auditoria de Segurança

Seguro

v4 • 1/17/2026

All 397 static findings are FALSE POSITIVES. This skill contains only markdown documentation with Python code examples. The static scanner incorrectly flags backticks in fenced code blocks, URLs in documentation links, and generic programming terms. No executable code, network operations, or credential handling exists. This is a legitimate scientific computing documentation skill for the AnnData Python library.

Arquivos analisados

4,567

Linhas analisadas

achados

Total de auditorias

Fatores de risco

⚙️ Comandos externos (2)

references/best_practices.md:1-526 SKILL.md:1-399

🌐 Acesso à rede (2)

SKILL.md:394-397 references/io_operations.md:283-295

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Análise de RNA-seq de célula única

Carregar e processar dados do 10X Genomics para pesquisa de transcriptômica de célula única com rastreamento adequado de metadados.

Integração de dados de múltiplos lotes

Combinar múltiplos lotes experimentais com rastreamento automático de rótulos de lote e resolução de conflitos.

Integração com aprendizado profundo

Exportar dados para PyTorch DataLoaders para treinar redes neurais em dados de expressão de célula única.

Tente Estes Prompts

Criar objeto AnnData

Criar um objeto AnnData a partir de um array numpy com metadados de observação para tipos de células e IDs de amostra.

Ler arquivo H5AD

Ler um arquivo H5AD em modo backed e filtrar para células de alta qualidade baseadas em uma coluna quality_score.

Concatenar lotes

Concatenar três objetos AnnData ao longo do eixo de observação com rótulos de lote e junção interna.

Otimizar memória

Mostrar como converter colunas de string para categóricas e usar matrizes esparsas para eficiência de memória.

Melhores Práticas

Use o modo backed (backed='r') para conjuntos de dados maiores que a RAM disponível para evitar erros de falta de memória.
Converta colunas de string para categóricas com strings_to_categoricals() para redução de memória de 10-50x.
Armazene dados brutos com adata.raw = adata.copy() antes de filtrar para preservar acesso a genes não filtrados.

Evitar

Evite modificar visualizações diretamente sem copiar primeiro, pois alterações podem afetar o objeto original.
Não carregue conjuntos de dados grandes inteiros na memória quando o modo backed pode fornecer acesso preguiçoso.
Evite desalinhamento de índice ao adicionar metadados externos usando set_index() e loc[].join().

Perguntas Frequentes

Qual é a diferença entre modo backed e modo em memória?

O modo backed mantém os dados em disco e carrega apenas as partes acessadas, permitindo trabalhar com conjuntos de dados maiores que a RAM.

Como combino múltiplos objetos AnnData para diferentes modalidades como RNA e proteína?

Use Muon (MuData) para combinar múltiplos objetos AnnData para diferentes modalidades como RNA e proteína.

Quando devo usar matrizes esparsas?

Use matrizes esparsas quando os dados têm mais de 50% de zeros, comum em dados de contagem de célula única.

Como rastreio de qual lote cada célula veio?

Use os parâmetros label e keys em ad.concat() para adicionar uma coluna de lote automaticamente.

Para que serve o atributo raw?

raw armazena um instantâneo dos dados antes da filtragem, permitindo acesso posterior aos genes originais não filtrados.

Como lido com erros de falta de memória?

Use modo backed, converta para matrizes esparsas, converta strings para categóricas, ou processe em blocos.

Detalhes do Desenvolvedor

Autor

K-Dense-AI

Licença

BSD-3-Clause license

Repositório

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/anndata

Referência

main

Estrutura de arquivos

📁 references/

📄 best_practices.md

📄 concatenation.md

📄 data_structure.md

📄 io_operations.md

📄 manipulation.md

📄 SKILL.md