pydeseq2
Analizar expresión génica diferencial de RNA-seq con PyDESeq2
También disponible en: davila7
PyDESeq2 permite el análisis de expresión génica diferencial a partir de datos de conteo de RNA-seq en bulk. Realiza pruebas estadísticas, corrección de comparaciones múltiples y genera gráficos volcano y MA listos para publicación en tu investigación genómica.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "pydeseq2". Analiza mis datos de RNA-seq y muestra los principales genes diferencialmente expresados
Resultado esperado:
- Análisis completo. Se encontraron 847 genes significativos (padj < 0.05)
- Principales genes sobreexpresados:
- - GeneX: log2FC = 4.2, padj = 1.3e-15
- - GeneY: log2FC = 3.8, padj = 2.7e-12
- - GeneZ: log2FC = 3.5, padj = 5.1e-11
- Principales genes infraexpresados:
- - GeneA: log2FC = -3.9, padj = 8.2e-14
- - GeneB: log2FC = -3.1, padj = 3.4e-10
- Resultados guardados en deseq2_results.csv
Auditoría de seguridad
SeguroAll 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.
Factores de riesgo
📁 Acceso al sistema de archivos (2)
🌐 Acceso a red (1)
Puntuación de calidad
Lo que puedes crear
Comparar tratado vs control
Identifica genes diferencialmente expresados entre condiciones experimentales usando pruebas estadísticas apropiadas y corrección FDR para resultados listos para publicación.
Análisis de tesis de RNA-seq
Procesa datos de conteo de RNA-seq, realiza análisis de expresión diferencial y genera figuras de calidad de publicación para tesis o artículos de investigación.
Procesamiento de RNA-seq en lote
Automatiza el análisis de expresión diferencial a través de múltiples condiciones o puntos temporales usando el script de línea de comandos incluido.
Prueba estos prompts
Carga mis datos de RNA-seq desde counts.csv y metadata.csv, luego realiza análisis de expresión diferencial comparando muestras tratadas vs control usando PyDESeq2
Analiza mis datos de RNA-seq corrigiendo efectos de batch usando fórmula de diseño ~batch + condition, luego prueba las diferencias entre tratamiento y control
Ejecuta análisis PyDESeq2 en mis datos y crea gráficos volcano y MA destacando genes significativos con padj < 0.05
Carga datos de RNA-seq, filtra genes con menos de 20 conteos totales, usa diseño multi-factor ~age + sex + condition, e identifica genes con |log2FC| > 1 y padj < 0.01
Mejores prácticas
- Siempre transponer la matriz de conteo si los genes están en filas (usar .T para obtener formato muestras × genes)
- Filtrar genes de bajo conteo antes del análisis para mejorar la potencia estadística
- Usar valores p ajustados (padj) en lugar de valores p crudos para determinar significancia
- Verificar que los nombres de muestra coincidan exactamente entre archivos de conteo y metadatos
Evitar
- Nunca usar valores p crudos para pruebas múltiples - siempre usar valores padj corregidos por FDR
- No aplicar shrinkage de LFC antes de pruebas estadísticas - usar después solo para visualización
- Evitar diseños multi-factor complejos sin tamaño de muestra suficiente por condición
- Nunca transponer metadatos - solo transponer la matriz de conteo si es necesario
Preguntas frecuentes
¿Por qué obtengo un error de índice?
¿Debo transponer mi matriz de conteo?
¿Cuál es la diferencia entre pvalue y padj?
¿Cuándo debo usar shrinkage de LFC?
¿Cómo manejo efectos de batch en mi análisis?
¿Por qué no hay genes significativos en mi análisis?
Detalles del desarrollador
Autor
K-Dense-AILicencia
MIT license
Repositorio
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/pydeseq2Ref.
main
Estructura de archivos