Habilidades pydeseq2
🧬

pydeseq2

Seguro 📁 Acesso ao sistema de arquivos🌐 Acesso à rede

Analisar expressão gênica diferencial de RNA-seq com PyDESeq2

Também disponível em: davila7

O PyDESeq2 permite análise de expressão gênica diferencial a partir de dados de contagem de RNA-seq em massa. Realize testes estatísticos, correção de comparações múltiplas e gere gráficos de volcano e MA prontos para publicação em sua pesquisa em genômica.

Suporta: Claude Codex Code(CC)
🥉 74 Bronze
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "pydeseq2". Analisar meus dados de RNA-seq e mostrar os principais genes diferencialmente expressos

Resultado esperado:

  • Análise completa. Encontrados 847 genes significativos (padj < 0,05)
  • Principais genes superexpressos:
  • - GeneX: log2FC = 4,2, padj = 1,3e-15
  • - GeneY: log2FC = 3,8, padj = 2,7e-12
  • - GeneZ: log2FC = 3,5, padj = 5,1e-11
  • Principais genes suberexpressos:
  • - GeneA: log2FC = -3,9, padj = 8,2e-14
  • - GeneB: log2FC = -3,1, padj = 3,4e-10
  • Resultados salvos em deseq2_results.csv

Auditoria de Segurança

Seguro
v4 • 1/17/2026

All 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.

5
Arquivos analisados
1,961
Linhas analisadas
2
achados
4
Total de auditorias

Fatores de risco

📁 Acesso ao sistema de arquivos (2)
🌐 Acesso à rede (1)
Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

64
Arquitetura
100
Manutenibilidade
83
Conteúdo
22
Comunidade
100
Segurança
78
Conformidade com especificações

O Que Você Pode Construir

Comparar tratado vs controle

Identificar genes diferencialmente expressos entre condições experimentais usando testes estatísticos adequados e correção FDR para resultados prontos para publicação.

Análise de RNA-seq para tese

Processar dados de contagem de RNA-seq, realizar análise de expressão diferencial e gerar figuras de qualidade para publicação em teses ou artigos científicos.

Processamento em lote de RNA-seq

Automatizar análise de expressão diferencial através de múltiplas condições ou pontos temporais usando o script de linha de comando incluído.

Tente Estes Prompts

Análise DE básica
Load my RNA-seq data from counts.csv and metadata.csv, then perform differential expression analysis comparing treated vs control samples using PyDESeq2
Design multifatorial
Analyze my RNA-seq data accounting for batch effects using design formula ~batch + condition, then test for treatment vs control differences
Gerar visualizações
Run PyDESeq2 analysis on my data and create volcano and MA plots highlighting significant genes with padj < 0.05
Filtragem avançada
Load RNA-seq data, filter genes with fewer than 20 total counts, use multi-factor design ~age + sex + condition, and identify genes with |log2FC| > 1 and padj < 0.01

Melhores Práticas

  • Sempre transpor a matriz de contagem se os genes forem linhas (use .T para obter formato amostras × genes)
  • Filtrar genes de baixa contagem antes da análise para melhorar o poder estatístico
  • Usar valores de p ajustados (padj) e não valores de p brutos para determinar significância
  • Verificar que os nomes das amostras correspondem exatamente entre os arquivos de contagem e metadados

Evitar

  • Nunca usar valores de p brutos para testes múltiplos - sempre usar valores padj corrigidos por FDR
  • Não aplicar encolhimento LFC antes de testes estatísticos - usar depois apenas para visualização
  • Evitar designs multifatoriais complexos sem tamanho amostral suficiente por condição
  • Nunca transpor metadados - apenas transpor a matriz de contagem se necessário

Perguntas Frequentes

Por que recebo um erro de incompatibilidade de índice?
Os nomes das amostras nos arquivos de contagem e metadados não correspondem. Certifique-se de que ambos os arquivos usam identificadores de amostra idênticos no mesmo formato.
Devo transpor minha matriz de contagem?
Se seu CSV tem genes como linhas e amostras como colunas, transponha com .T para obter o formato amostras × genes necessário.
Qual é a diferença entre pvalue e padj?
pvalue é o valor de p estatístico bruto; padj é o valor corrigido por FDR para testes múltiplos. Use padj < 0,05 para significância.
Quando devo usar encolhimento LFC?
Aplique encolhimento LFC após testes estatísticos para visualização, ordenação de genes ou criação de heatmaps. Não use para determinação de significância.
Como lidar com efeitos de lote na minha análise?
Inclua lote em sua fórmula de design como ~batch + condition. Isso controla variação técnica enquanto testa diferenças biológicas.
Por que nenhum gene é significativo na minha análise?
Verifique seu tamanho de estudo, tamanhos de efeito e variabilidade biológica. Estudos pequenos ou efeitos sutis podem gerar poucos genes significativos.

Detalhes do Desenvolvedor

Estrutura de arquivos