Habilidades pydeseq2
🧬

pydeseq2

Seguro 📁 Acceso al sistema de archivos🌐 Acceso a red

Analizar expresión génica diferencial de RNA-seq con PyDESeq2

También disponible en: davila7

PyDESeq2 permite el análisis de expresión génica diferencial a partir de datos de conteo de RNA-seq en bulk. Realiza pruebas estadísticas, corrección de comparaciones múltiples y genera gráficos volcano y MA listos para publicación en tu investigación genómica.

Soporta: Claude Codex Code(CC)
🥉 74 Bronce
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "pydeseq2". Analiza mis datos de RNA-seq y muestra los principales genes diferencialmente expresados

Resultado esperado:

  • Análisis completo. Se encontraron 847 genes significativos (padj < 0.05)
  • Principales genes sobreexpresados:
  • - GeneX: log2FC = 4.2, padj = 1.3e-15
  • - GeneY: log2FC = 3.8, padj = 2.7e-12
  • - GeneZ: log2FC = 3.5, padj = 5.1e-11
  • Principales genes infraexpresados:
  • - GeneA: log2FC = -3.9, padj = 8.2e-14
  • - GeneB: log2FC = -3.1, padj = 3.4e-10
  • Resultados guardados en deseq2_results.csv

Auditoría de seguridad

Seguro
v4 • 1/17/2026

All 429 static findings are false positives. The 'weak cryptographic algorithm' flags incorrectly match 'DES' in 'DESeq2' (a statistical method name, not cryptography). The 'external_commands' flags misinterpret markdown code fences as shell execution. Filesystem access is standard data I/O for bioinformatics workflows. Network access involves only documentation URLs. This is a legitimate scientific computing skill with no malicious code.

5
Archivos escaneados
1,961
Líneas analizadas
2
hallazgos
4
Auditorías totales

Factores de riesgo

📁 Acceso al sistema de archivos (2)
🌐 Acceso a red (1)

Puntuación de calidad

64
Arquitectura
100
Mantenibilidad
83
Contenido
22
Comunidad
100
Seguridad
78
Cumplimiento de la especificación

Lo que puedes crear

Comparar tratado vs control

Identifica genes diferencialmente expresados entre condiciones experimentales usando pruebas estadísticas apropiadas y corrección FDR para resultados listos para publicación.

Análisis de tesis de RNA-seq

Procesa datos de conteo de RNA-seq, realiza análisis de expresión diferencial y genera figuras de calidad de publicación para tesis o artículos de investigación.

Procesamiento de RNA-seq en lote

Automatiza el análisis de expresión diferencial a través de múltiples condiciones o puntos temporales usando el script de línea de comandos incluido.

Prueba estos prompts

Análisis DE básico
Carga mis datos de RNA-seq desde counts.csv y metadata.csv, luego realiza análisis de expresión diferencial comparando muestras tratadas vs control usando PyDESeq2
Diseño multi-factor
Analiza mis datos de RNA-seq corrigiendo efectos de batch usando fórmula de diseño ~batch + condition, luego prueba las diferencias entre tratamiento y control
Generar visualizaciones
Ejecuta análisis PyDESeq2 en mis datos y crea gráficos volcano y MA destacando genes significativos con padj < 0.05
Filtrado avanzado
Carga datos de RNA-seq, filtra genes con menos de 20 conteos totales, usa diseño multi-factor ~age + sex + condition, e identifica genes con |log2FC| > 1 y padj < 0.01

Mejores prácticas

  • Siempre transponer la matriz de conteo si los genes están en filas (usar .T para obtener formato muestras × genes)
  • Filtrar genes de bajo conteo antes del análisis para mejorar la potencia estadística
  • Usar valores p ajustados (padj) en lugar de valores p crudos para determinar significancia
  • Verificar que los nombres de muestra coincidan exactamente entre archivos de conteo y metadatos

Evitar

  • Nunca usar valores p crudos para pruebas múltiples - siempre usar valores padj corregidos por FDR
  • No aplicar shrinkage de LFC antes de pruebas estadísticas - usar después solo para visualización
  • Evitar diseños multi-factor complejos sin tamaño de muestra suficiente por condición
  • Nunca transponer metadatos - solo transponer la matriz de conteo si es necesario

Preguntas frecuentes

¿Por qué obtengo un error de índice?
Los nombres de muestra en los archivos de conteo y metadatos no coinciden. Asegúrate de que ambos archivos usen identificadores de muestra idénticos en el mismo formato.
¿Debo transponer mi matriz de conteo?
Si tu CSV tiene genes como filas y muestras como columnas, transponer con .T para obtener el formato requerido muestras × genes.
¿Cuál es la diferencia entre pvalue y padj?
pvalue es el valor p estadístico crudo; padj es el valor corregido por FDR para pruebas múltiples. Usa padj < 0.05 para significancia.
¿Cuándo debo usar shrinkage de LFC?
Aplica shrinkage de LFC después de pruebas estadísticas para visualización, ranking de genes, o crear heatmaps. No uses para determinación de significancia.
¿Cómo manejo efectos de batch en mi análisis?
Incluye batch en tu fórmula de diseño como ~batch + condition. Esto controla la variación técnica mientras prueba diferencias biológicas.
¿Por qué no hay genes significativos en mi análisis?
Revisa tu tamaño de muestra, tamaños de efecto y variabilidad biológica. Estudios pequeños o efectos sutiles pueden producir pocos genes significativos.

Detalles del desarrollador

Estructura de archivos