gtars
Analisar intervalos genômicos e trilhas de cobertura
Também disponível em: davila7
Processar e analisar dados de intervalos genômicos para pesquisa em bioinformática. O Gtars oferece ferramentas de alto desempenho para detecção de sobreposição, análise de cobertura e tokenização de ML de sequências genômicas.
Baixar o ZIP da skill
Upload no Claude
Vá em Configurações → Capacidades → Skills → Upload skill
Ative e comece a usar
Testar
A utilizar "gtars". Encontrar sobreposições entre meus picos de ChIP-seq e promotores de genes
Resultado esperado:
- Picos sobrepostos: 1.234 regiões encontradas
- Distribuição de picos: 45% em regiões de promotores, 30% em intensificadores, 25% intergênico
- Resultados salvos em peaks_in_promoters.bed
A utilizar "gtars". Gerar trilha de cobertura a partir de dados de ATAC-seq
Resultado esperado:
- Trilha de cobertura gerada: atac_coverage.bw
- Resolução: 10pb
- Total de bases cobertas: 2,1 bilhões
- Regiões de acessibilidade de pico identificadas: 150.000
Auditoria de Segurança
SeguroAll 209 static findings are false positives. The static analyzer incorrectly flagged markdown documentation syntax as security risks. No malicious code present. This is a legitimate genomic analysis toolkit.
Fatores de risco
⚙️ Comandos externos (3)
📁 Acesso ao sistema de arquivos (1)
Pontuação de qualidade
O Que Você Pode Construir
Análise de sobreposição de picos
Identificar elementos regulatórios sobrepostos e anotar variantes comparando picos de ChIP-seq.
Visualização de cobertura
Gerar trilhas de cobertura a partir de dados de ATAC-seq ou ChIP-seq para visualização no navegador do genoma.
Pré-processamento de ML genômico
Converter regiões genômicas em tokens discretos para treinar modelos transformadores em sequências de DNA.
Tente Estes Prompts
Use gtars para construir um índice IGD a partir do meu arquivo peaks.bed e consultar sobreposições com promoters.bed.
Gerar uma trilha de cobertura BigWig a partir dos meus fragmentos de ATAC-seq usando gtars uniwig com resolução de 10pb.
Criar um TreeTokenizer a partir do meu training_regions.bed e tokenizar as coordenadas genômicas para entrada do modelo de ML.
Dividir meu fragments.tsv por barcodes de células usando gtars fragsplit e enviar para diretórios específicos do cluster.
Melhores Práticas
- Usar o modo de mapeamento de memória (mmap=True) ao processar arquivos genômicos grandes para melhor desempenho.
- Construir índices IGD uma vez e reutilizá-los para múltiplas consultas de sobreposição.
- Especificar a contagem de threads explicitamente para uso previsível de recursos em processamento em lote.
Evitar
- Não processar arquivos em escala de GB sem habilitar o modo de mapeamento de memória.
- Evitar executar múltiplos comandos gtars sequencialmente quando processamento paralelo está disponível.
- Não pular a validação de formato ao integrar com pipelines externos.
Perguntas Frequentes
Quais formatos de arquivo o gtars suporta?
Preciso ter Rust instalado para usar o gtars?
Como o gtars se compara ao bedtools?
O gtars consegue lidar com arquivos em escala de cromossomo?
O que é indexação IGD?
O gtars é compatível com o geniml?
Detalhes do Desenvolvedor
Autor
K-Dense-AILicença
MIT
Repositório
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/gtarsReferência
main