🧬

geniml

Seguro ⚙️ Comandos externos

Analizar intervalos genómicos con aprendizaje automático

También disponible en: davila7

Geniml transforma archivos BED en incrustaciones de aprendizaje automático para el análisis de regiones genómicas. Entrena modelos para encontrar patrones en la accesibilidad de cromatina, construye conjuntos de picos de consenso y analiza datos de ATAC-seq de célula única.

Soporta: Claude Codex Code(CC)
📊 71 Adecuado
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "geniml". Entrenar region2vec en mis picos de ATAC-seq y evaluar las incrustaciones

Resultado esperado:

  • Tokenizó 15.234 picos usando archivo de universo
  • Entrenó incrustaciones de 100 dimensiones para 8.567 regiones únicas
  • Puntuación de silueta: 0.72 (buena calidad de agrupamiento)
  • Índice de Davies-Bouldin: 0.85 (baja similitud entre grupos)
  • Generó UMAP 2D para visualización

Usando "geniml". Construir un universo de picos de consenso a partir de 10 experimentos de ATAC-seq

Resultado esperado:

  • Combinó 245.000 picos de todos los experimentos
  • Aplicó método de cutoff de cobertura con umbral de 5x
  • Generó universo de consenso con 32.450 regiones
  • Cobertura de picos de entrada: 87.3%
  • Tamaño medio de región: 425pb (apropiado para ATAC-seq)

Usando "geniml". Analizar datos de ATAC-seq de célula única para anotación de tipos celulares

Resultado esperado:

  • Pretokenizó 8.500 células del conjunto de datos PBMC
  • Entrenó modelo scEmbed con 100 dimensiones
  • Generó incrustaciones de células para todas las células
  • Agrupamiento de Leiden identificó 12 poblaciones celulares distintas
  • Anotó tipos principales: células T, células B, monocitos, células NK

Auditoría de seguridad

Seguro
v4 • 1/17/2026

Static analysis flagged 194 patterns, but ALL are false positives. The 'external_commands' findings are markdown bash code blocks in documentation (not actual shell execution). 'Weak cryptographic' refers to MD5 checksums for file verification (legitimate bioinformatics practice). 'Ransomware keywords' is a false positive triggered by security audit text itself. 'Hidden file access' refers to standard cache directories. All patterns represent legitimate genomic ML workflows.

8
Archivos escaneados
2,570
Líneas analizadas
1
hallazgos
4
Auditorías totales

Puntuación de calidad

45
Arquitectura
100
Mantenibilidad
87
Contenido
21
Comunidad
100
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Comparar experimentos de ChIP-seq

Entrenar incrustaciones de regiones para encontrar picos similares en diferentes experimentos de unión de factores de transcripción

Agrupar células por cromatina

Usar scEmbed para analizar datos de scATAC-seq e identificar tipos de celular basados en patrones de accesibilidad de cromatina

Construir conjuntos de picos de referencia

Crear universos de consenso a partir de múltiples experimentos de ATAC-seq para análisis estandarizados

Prueba estos prompts

Entrenar incrustaciones de regiones
Ayúdame a entrenar incrustaciones region2vec en mis archivos BED. Primero tokenízalos usando un archivo de universo, luego entrena un modelo de incrustación de 100 dimensiones.
Analizar scATAC-seq
Usa scEmbed para analizar mis datos de scATAC-seq en scanpy. Tokeniza las células, entrena un modelo de incrustación y genera visualización UMAP.
Construir picos de consenso
Construye un universo de consenso a partir de mi colección de archivos BED usando el método de cutoff de cobertura con umbral de 5x.
Incrutaciones conjuntas de región-etiqueta
Entrena incrustaciones BEDspace en regiones con etiquetas de tipo celular para permitir consultas entre modalidades entre regiones y metadatos.

Mejores prácticas

  • Siempre construye universos de alta calidad con buena cobertura de picos antes de entrenar incrustaciones
  • Valida la cobertura de tokenización (mayor al 80 por ciento) y ajusta los umbrales de valor p si es necesario
  • Usa múltiples métricas de evaluación para evaluar la calidad de las incrustaciones y la relevancia biológica

Evitar

  • Entrenar en conjuntos de picos de baja calidad o desalineados sin construir universos adecuados
  • Usar parámetros por defecto sin ajustar para tu tipo de datos y escala específicos
  • Saltarse los pasos de evaluación - siempre valida las incrustaciones antes del análisis posterior

Preguntas frecuentes

¿Qué formatos de archivo soporta geniml?
Geniml funciona con archivos BED estándar (3+ columnas) para regiones genómicas y archivos CSV para metadatos.
¿Cómo elijo la dimensión de incrustación?
Comienza con 100 dimensiones para la mayoría de los análisis. Usa 50 para conjuntos de datos pequeños, 200+ para escenarios complejos de múltiples etiquetas.
¿Puedo usar geniml con otras herramientas de célula única?
Sí, las salidas de scEmbed se integran perfectamente con scanpy como incrustaciones adata.obsm para agrupamiento y visualización.
¿Cuál es la diferencia entre Region2Vec y BEDspace?
Region2Vec entrena solo en regiones. BEDspace incrusta conjuntamente regiones y etiquetas de metadatos para consultas entre modalidades.
¿Cuánto tiempo dura el entrenamiento?
Minutos para conjuntos de datos pequeños (miles de regiones), horas para grandes colecciones. Usa GPU para scEmbed en grandes datos de célula única.
¿Necesito un archivo de universo?
Sí, para tokenización. Construye uno con picos de consenso o usa una referencia como ENCODE SCREEN.

Detalles del desarrollador

Estructura de archivos