anndata
Trabalhar com matrizes AnnData
Também disponível em: davila7
AnnData fornece uma estrutura de dados padronizada para matrizes anotadas usadas em genômica de célula única. Esta habilidade permite criar, ler, escrever e manipular arquivos .h5ad com suporte completo para metadados, embeddings e o ecossistema scverse.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "anndata". Como faço para ler um arquivo H5 do 10X Genomics e convertê-lo para AnnData?
Resultado esperado:
- Use ad.read_10x_h5() para ler o formato H5 diretamente
- A função lida com extração de genes e códigos de barras automaticamente
- Parâmetro genome opcional para selecionar referência específica quando houver múltiplas
A utilizar "anndata". O que é modo backed e quando devo usá-lo?
Resultado esperado:
- O modo backed mantém os dados em disco e carrega apenas as partes acessadas
- Use-o para conjuntos de dados maiores que a RAM disponível para evitar erros de falta de memória
- Acesse metadados e crie subconjuntos sem carregar o arquivo inteiro na memória
Auditoria de Segurança
SeguroAll 397 static findings are FALSE POSITIVES. This skill contains only markdown documentation with Python code examples. The static scanner incorrectly flags backticks in fenced code blocks, URLs in documentation links, and generic programming terms. No executable code, network operations, or credential handling exists. This is a legitimate scientific computing documentation skill for the AnnData Python library.
Fatores de risco
⚙️ Comandos externos (2)
🌐 Acesso à rede (2)
Pontuação de qualidade
O Que Você Pode Construir
Análise de RNA-seq de célula única
Carregar e processar dados do 10X Genomics para pesquisa de transcriptômica de célula única com rastreamento adequado de metadados.
Integração de dados de múltiplos lotes
Combinar múltiplos lotes experimentais com rastreamento automático de rótulos de lote e resolução de conflitos.
Integração com aprendizado profundo
Exportar dados para PyTorch DataLoaders para treinar redes neurais em dados de expressão de célula única.
Tente Estes Prompts
Criar um objeto AnnData a partir de um array numpy com metadados de observação para tipos de células e IDs de amostra.
Ler um arquivo H5AD em modo backed e filtrar para células de alta qualidade baseadas em uma coluna quality_score.
Concatenar três objetos AnnData ao longo do eixo de observação com rótulos de lote e junção interna.
Mostrar como converter colunas de string para categóricas e usar matrizes esparsas para eficiência de memória.
Melhores Práticas
- Use o modo backed (backed='r') para conjuntos de dados maiores que a RAM disponível para evitar erros de falta de memória.
- Converta colunas de string para categóricas com strings_to_categoricals() para redução de memória de 10-50x.
- Armazene dados brutos com adata.raw = adata.copy() antes de filtrar para preservar acesso a genes não filtrados.
Evitar
- Evite modificar visualizações diretamente sem copiar primeiro, pois alterações podem afetar o objeto original.
- Não carregue conjuntos de dados grandes inteiros na memória quando o modo backed pode fornecer acesso preguiçoso.
- Evite desalinhamento de índice ao adicionar metadados externos usando set_index() e loc[].join().
Perguntas Frequentes
Qual é a diferença entre modo backed e modo em memória?
Como combino múltiplos objetos AnnData para diferentes modalidades como RNA e proteína?
Quando devo usar matrizes esparsas?
Como rastreio de qual lote cada célula veio?
Para que serve o atributo raw?
Como lido com erros de falta de memória?
Detalhes do Desenvolvedor
Autor
K-Dense-AILicença
BSD-3-Clause license
Repositório
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/anndataReferência
main
Estrutura de arquivos