geo-database
Acceder a datos de expresión génica de NCBI GEO
También disponible en: davila7
Los investigadores necesitan acceso eficiente a conjuntos de datos de expresión génica para su análisis. Esta habilidad permite consultar, descargar y analizar datos de la base de datos GEO de NCBI que contiene millones de muestras genómicas.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "geo-database". Search for diabetes gene expression datasets in humans
Resultado esperado:
- Se encontraron 1,247 conjuntos de datos que coinciden con 'diabetes AND Homo sapiens'
- Resultados principales:
- - GSE12345: Expresión génica en diabetes tipo 2 (47 muestras)
- - GSE67890: Estudio de nefropatía diabética (32 muestras)
- - GSE11111: Curso temporal de respuesta a la insulina (24 muestras)
Usando "geo-database". Download GSE12345 and extract metadata
Resultado esperado:
- Descargado GSE12345_series_matrix.txt.gz (145 MB)
- Resumen del conjunto de datos:
- - Título: Perfilado del transcriptoma de riñón diabético vs normal
- - Muestras: 20 (10 diabéticas, 10 control)
- - Plataforma: GPL570 (Affymetrix Human Genome U133 Plus 2.0)
- - Organismo: Homo sapiens
- - Fecha de envío: 2023-06-15
Auditoría de seguridad
Riesgo bajoDocumentation-only skill for accessing NCBI GEO database. Static analysis flagged 256 pattern-based issues but all are false positives. The 'backtick execution' findings are markdown code block syntax, not actual shell commands. Network operations are legitimate NCBI API access. FTP downloads target public GEO data repositories. Optional API key usage follows NCBI best practices. No executable code present - only documentation.
Factores de riesgo
🌐 Acceso a red (3)
⚙️ Comandos externos (3)
📁 Acceso al sistema de archivos (1)
Puntuación de calidad
Lo que puedes crear
Analizar la expresión génica en enfermedades
Descargar y comparar datos de expresión génica entre muestras de tejido sano y enfermo para identificar biomarcadores.
Metaanálisis entre estudios
Combinar datos de múltiples estudios GEO para aumentar la potencia estadística al detectar cambios de expresión génica.
Construir modelos predictivos
Usar datos de expresión de GEO para entrenar modelos de aprendizaje automático para la predicción de respuesta a fármacos o la estratificación de pacientes.
Prueba estos prompts
Search GEO for human breast cancer gene expression datasets from the last 5 years. Show the top 5 results with sample counts and platforms used.
Download the expression matrix and metadata for GSE12345. Save the files to ./data/ and show a summary of the dataset including number of samples and genes.
Perform differential expression analysis on GSE12345 comparing treatment vs control samples. Use limma or t-test and show the top 10 most significant genes.
Download and process these 3 GEO series: GSE100001, GSE100002, GSE100003. Extract expression data and create a summary table with study metadata.
Mejores prácticas
- Establece siempre tu correo electrónico al usar NCBI E-utilities (requerido por la política de NCBI)
- Obtén una clave de API gratuita de NCBI para aumentar los límites de tasa (10 req/s vs 3 req/s)
- Almacena en caché los archivos GEO descargados localmente para evitar descargas repetidas
Evitar
- No descargues toda la base de datos GEO: sé selectivo con los accesos
- No codifiques claves de API en código compartido o bajo control de versiones
- No ignores los metadatos de las muestras al interpretar los datos de expresión
Preguntas frecuentes
¿Necesito una clave de API para acceder a GEO?
¿Cuál es la diferencia entre GSE, GSM y GPL?
¿Por qué faltan datos de expresión en algunas series?
¿Cómo manejo conjuntos de datos GEO muy grandes?
¿Puedo usar datos de GEO para investigación clínica?
¿Qué formato de archivo debo usar para datos de expresión?
Detalles del desarrollador
Autor
K-Dense-AILicencia
MIT
Repositorio
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/geo-databaseRef.
main
Estructura de archivos