🧬

pydeseq2

Name: pydeseq2
Author: K-Dense-AI

Seguro 📁 Acceso al sistema de archivos🌐 Acceso a red

Analizar expresión génica diferencial de RNA-seq con PyDESeq2

También disponible en: davila7

PyDESeq2 permite el análisis de expresión génica diferencial a partir de datos de conteo de RNA-seq en bulk. Realiza pruebas estadísticas, corrección de comparaciones múltiples y genera gráficos volcano y MA listos para publicación en tu investigación genómica.

Soporta: Claude Codex Code(CC)

🥉 74 Bronce

Descargar el ZIP de la skill

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

Activa y empieza a usar

Pruébalo

Usando "pydeseq2". Analiza mis datos de RNA-seq y muestra los principales genes diferencialmente expresados

Resultado esperado:

Análisis completo. Se encontraron 847 genes significativos (padj < 0.05)
Principales genes sobreexpresados:
- GeneX: log2FC = 4.2, padj = 1.3e-15
- GeneY: log2FC = 3.8, padj = 2.7e-12
- GeneZ: log2FC = 3.5, padj = 5.1e-11
Principales genes infraexpresados:
- GeneA: log2FC = -3.9, padj = 8.2e-14
- GeneB: log2FC = -3.1, padj = 3.4e-10
Resultados guardados en deseq2_results.csv

Auditoría de seguridad

Seguro

v4 • 1/17/2026

All 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.

Archivos escaneados

1,961

Líneas analizadas

hallazgos

Auditorías totales

Factores de riesgo

📁 Acceso al sistema de archivos (2)

scripts/run_deseq2_analysis.py:180-185 SKILL.md:211-213

🌐 Acceso a red (1)

SKILL.md:553-556

Auditado por: claude Ver historial de auditorías →

Puntuación de calidad

Arquitectura

100

Mantenibilidad

Contenido

Comunidad

100

Seguridad

Cumplimiento de la especificación

Lo que puedes crear

Comparar tratado vs control

Identifica genes diferencialmente expresados entre condiciones experimentales usando pruebas estadísticas apropiadas y corrección FDR para resultados listos para publicación.

Análisis de tesis de RNA-seq

Procesa datos de conteo de RNA-seq, realiza análisis de expresión diferencial y genera figuras de calidad de publicación para tesis o artículos de investigación.

Procesamiento de RNA-seq en lote

Automatiza el análisis de expresión diferencial a través de múltiples condiciones o puntos temporales usando el script de línea de comandos incluido.

Prueba estos prompts

Análisis DE básico

Carga mis datos de RNA-seq desde counts.csv y metadata.csv, luego realiza análisis de expresión diferencial comparando muestras tratadas vs control usando PyDESeq2

Diseño multi-factor

Analiza mis datos de RNA-seq corrigiendo efectos de batch usando fórmula de diseño ~batch + condition, luego prueba las diferencias entre tratamiento y control

Generar visualizaciones

Ejecuta análisis PyDESeq2 en mis datos y crea gráficos volcano y MA destacando genes significativos con padj < 0.05

Filtrado avanzado

Carga datos de RNA-seq, filtra genes con menos de 20 conteos totales, usa diseño multi-factor ~age + sex + condition, e identifica genes con |log2FC| > 1 y padj < 0.01

Mejores prácticas

Siempre transponer la matriz de conteo si los genes están en filas (usar .T para obtener formato muestras × genes)
Filtrar genes de bajo conteo antes del análisis para mejorar la potencia estadística
Usar valores p ajustados (padj) en lugar de valores p crudos para determinar significancia
Verificar que los nombres de muestra coincidan exactamente entre archivos de conteo y metadatos

Evitar

Nunca usar valores p crudos para pruebas múltiples - siempre usar valores padj corregidos por FDR
No aplicar shrinkage de LFC antes de pruebas estadísticas - usar después solo para visualización
Evitar diseños multi-factor complejos sin tamaño de muestra suficiente por condición
Nunca transponer metadatos - solo transponer la matriz de conteo si es necesario

Preguntas frecuentes

¿Por qué obtengo un error de índice?

Los nombres de muestra en los archivos de conteo y metadatos no coinciden. Asegúrate de que ambos archivos usen identificadores de muestra idénticos en el mismo formato.

¿Debo transponer mi matriz de conteo?

Si tu CSV tiene genes como filas y muestras como columnas, transponer con .T para obtener el formato requerido muestras × genes.

¿Cuál es la diferencia entre pvalue y padj?

pvalue es el valor p estadístico crudo; padj es el valor corregido por FDR para pruebas múltiples. Usa padj < 0.05 para significancia.

¿Cuándo debo usar shrinkage de LFC?

Aplica shrinkage de LFC después de pruebas estadísticas para visualización, ranking de genes, o crear heatmaps. No uses para determinación de significancia.

¿Cómo manejo efectos de batch en mi análisis?

Incluye batch en tu fórmula de diseño como ~batch + condition. Esto controla la variación técnica mientras prueba diferencias biológicas.

¿Por qué no hay genes significativos en mi análisis?

Revisa tu tamaño de muestra, tamaños de efecto y variabilidad biológica. Estudios pequeños o efectos sutiles pueden producir pocos genes significativos.

Detalles del desarrollador

Autor

K-Dense-AI

Licencia

MIT license

Repositorio

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/pydeseq2

Ref.

main

Estructura de archivos

📁 references/

📄 api_reference.md

📄 workflow_guide.md

📁 scripts/

📄 run_deseq2_analysis.py

📄 SKILL.md