geniml
Analizar intervalos genómicos con aprendizaje automático
También disponible en: davila7
Geniml transforma archivos BED en incrustaciones de aprendizaje automático para el análisis de regiones genómicas. Entrena modelos para encontrar patrones en la accesibilidad de cromatina, construye conjuntos de picos de consenso y analiza datos de ATAC-seq de célula única.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "geniml". Entrenar region2vec en mis picos de ATAC-seq y evaluar las incrustaciones
Resultado esperado:
- Tokenizó 15.234 picos usando archivo de universo
- Entrenó incrustaciones de 100 dimensiones para 8.567 regiones únicas
- Puntuación de silueta: 0.72 (buena calidad de agrupamiento)
- Índice de Davies-Bouldin: 0.85 (baja similitud entre grupos)
- Generó UMAP 2D para visualización
Usando "geniml". Construir un universo de picos de consenso a partir de 10 experimentos de ATAC-seq
Resultado esperado:
- Combinó 245.000 picos de todos los experimentos
- Aplicó método de cutoff de cobertura con umbral de 5x
- Generó universo de consenso con 32.450 regiones
- Cobertura de picos de entrada: 87.3%
- Tamaño medio de región: 425pb (apropiado para ATAC-seq)
Usando "geniml". Analizar datos de ATAC-seq de célula única para anotación de tipos celulares
Resultado esperado:
- Pretokenizó 8.500 células del conjunto de datos PBMC
- Entrenó modelo scEmbed con 100 dimensiones
- Generó incrustaciones de células para todas las células
- Agrupamiento de Leiden identificó 12 poblaciones celulares distintas
- Anotó tipos principales: células T, células B, monocitos, células NK
Auditoría de seguridad
SeguroStatic analysis flagged 194 patterns, but ALL are false positives. The 'external_commands' findings are markdown bash code blocks in documentation (not actual shell execution). 'Weak cryptographic' refers to MD5 checksums for file verification (legitimate bioinformatics practice). 'Ransomware keywords' is a false positive triggered by security audit text itself. 'Hidden file access' refers to standard cache directories. All patterns represent legitimate genomic ML workflows.
Factores de riesgo
Puntuación de calidad
Lo que puedes crear
Comparar experimentos de ChIP-seq
Entrenar incrustaciones de regiones para encontrar picos similares en diferentes experimentos de unión de factores de transcripción
Agrupar células por cromatina
Usar scEmbed para analizar datos de scATAC-seq e identificar tipos de celular basados en patrones de accesibilidad de cromatina
Construir conjuntos de picos de referencia
Crear universos de consenso a partir de múltiples experimentos de ATAC-seq para análisis estandarizados
Prueba estos prompts
Ayúdame a entrenar incrustaciones region2vec en mis archivos BED. Primero tokenízalos usando un archivo de universo, luego entrena un modelo de incrustación de 100 dimensiones.
Usa scEmbed para analizar mis datos de scATAC-seq en scanpy. Tokeniza las células, entrena un modelo de incrustación y genera visualización UMAP.
Construye un universo de consenso a partir de mi colección de archivos BED usando el método de cutoff de cobertura con umbral de 5x.
Entrena incrustaciones BEDspace en regiones con etiquetas de tipo celular para permitir consultas entre modalidades entre regiones y metadatos.
Mejores prácticas
- Siempre construye universos de alta calidad con buena cobertura de picos antes de entrenar incrustaciones
- Valida la cobertura de tokenización (mayor al 80 por ciento) y ajusta los umbrales de valor p si es necesario
- Usa múltiples métricas de evaluación para evaluar la calidad de las incrustaciones y la relevancia biológica
Evitar
- Entrenar en conjuntos de picos de baja calidad o desalineados sin construir universos adecuados
- Usar parámetros por defecto sin ajustar para tu tipo de datos y escala específicos
- Saltarse los pasos de evaluación - siempre valida las incrustaciones antes del análisis posterior
Preguntas frecuentes
¿Qué formatos de archivo soporta geniml?
¿Cómo elijo la dimensión de incrustación?
¿Puedo usar geniml con otras herramientas de célula única?
¿Cuál es la diferencia entre Region2Vec y BEDspace?
¿Cuánto tiempo dura el entrenamiento?
¿Necesito un archivo de universo?
Detalles del desarrollador
Autor
K-Dense-AILicencia
BSD-2-Clause license
Repositorio
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/genimlRef.
main
Estructura de archivos