🧬

pydeseq2

Name: pydeseq2
Author: K-Dense-AI

Seguro 📁 Acesso ao sistema de arquivos🌐 Acesso à rede

Analisar expressão gênica diferencial de RNA-seq com PyDESeq2

Também disponível em: davila7

O PyDESeq2 permite análise de expressão gênica diferencial a partir de dados de contagem de RNA-seq em massa. Realize testes estatísticos, correção de comparações múltiplas e gere gráficos de volcano e MA prontos para publicação em sua pesquisa em genômica.

Suporta: Claude Codex Code(CC)

🥉 74 Bronze

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "pydeseq2". Analisar meus dados de RNA-seq e mostrar os principais genes diferencialmente expressos

Resultado esperado:

Análise completa. Encontrados 847 genes significativos (padj < 0,05)
Principais genes superexpressos:
- GeneX: log2FC = 4,2, padj = 1,3e-15
- GeneY: log2FC = 3,8, padj = 2,7e-12
- GeneZ: log2FC = 3,5, padj = 5,1e-11
Principais genes suberexpressos:
- GeneA: log2FC = -3,9, padj = 8,2e-14
- GeneB: log2FC = -3,1, padj = 3,4e-10
Resultados salvos em deseq2_results.csv

Auditoria de Segurança

Seguro

v4 • 1/17/2026

All 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.

Arquivos analisados

1,961

Linhas analisadas

achados

Total de auditorias

Fatores de risco

📁 Acesso ao sistema de arquivos (2)

scripts/run_deseq2_analysis.py:180-185 SKILL.md:211-213

🌐 Acesso à rede (1)

SKILL.md:553-556

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Comparar tratado vs controle

Identificar genes diferencialmente expressos entre condições experimentais usando testes estatísticos adequados e correção FDR para resultados prontos para publicação.

Análise de RNA-seq para tese

Processar dados de contagem de RNA-seq, realizar análise de expressão diferencial e gerar figuras de qualidade para publicação em teses ou artigos científicos.

Processamento em lote de RNA-seq

Automatizar análise de expressão diferencial através de múltiplas condições ou pontos temporais usando o script de linha de comando incluído.

Tente Estes Prompts

Análise DE básica

Load my RNA-seq data from counts.csv and metadata.csv, then perform differential expression analysis comparing treated vs control samples using PyDESeq2

Design multifatorial

Analyze my RNA-seq data accounting for batch effects using design formula ~batch + condition, then test for treatment vs control differences

Gerar visualizações

Run PyDESeq2 analysis on my data and create volcano and MA plots highlighting significant genes with padj < 0.05

Filtragem avançada

Load RNA-seq data, filter genes with fewer than 20 total counts, use multi-factor design ~age + sex + condition, and identify genes with |log2FC| > 1 and padj < 0.01

Melhores Práticas

Sempre transpor a matriz de contagem se os genes forem linhas (use .T para obter formato amostras × genes)
Filtrar genes de baixa contagem antes da análise para melhorar o poder estatístico
Usar valores de p ajustados (padj) e não valores de p brutos para determinar significância
Verificar que os nomes das amostras correspondem exatamente entre os arquivos de contagem e metadados

Evitar

Nunca usar valores de p brutos para testes múltiplos - sempre usar valores padj corrigidos por FDR
Não aplicar encolhimento LFC antes de testes estatísticos - usar depois apenas para visualização
Evitar designs multifatoriais complexos sem tamanho amostral suficiente por condição
Nunca transpor metadados - apenas transpor a matriz de contagem se necessário

Perguntas Frequentes

Por que recebo um erro de incompatibilidade de índice?

Os nomes das amostras nos arquivos de contagem e metadados não correspondem. Certifique-se de que ambos os arquivos usam identificadores de amostra idênticos no mesmo formato.

Devo transpor minha matriz de contagem?

Se seu CSV tem genes como linhas e amostras como colunas, transponha com .T para obter o formato amostras × genes necessário.

Qual é a diferença entre pvalue e padj?

pvalue é o valor de p estatístico bruto; padj é o valor corrigido por FDR para testes múltiplos. Use padj < 0,05 para significância.

Quando devo usar encolhimento LFC?

Aplique encolhimento LFC após testes estatísticos para visualização, ordenação de genes ou criação de heatmaps. Não use para determinação de significância.

Como lidar com efeitos de lote na minha análise?

Inclua lote em sua fórmula de design como ~batch + condition. Isso controla variação técnica enquanto testa diferenças biológicas.

Por que nenhum gene é significativo na minha análise?

Verifique seu tamanho de estudo, tamanhos de efeito e variabilidade biológica. Estudos pequenos ou efeitos sutis podem gerar poucos genes significativos.

Detalhes do Desenvolvedor

Autor

K-Dense-AI

Licença

MIT license

Repositório

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/pydeseq2

Referência

main

Estrutura de arquivos

📁 references/

📄 api_reference.md

📄 workflow_guide.md

📁 scripts/

📄 run_deseq2_analysis.py

📄 SKILL.md