Habilidades geo-database
🧬

geo-database

Riesgo bajo 🌐 Acceso a red⚙️ Comandos externos📁 Acceso al sistema de archivos

Acceder a datos de expresión génica de NCBI GEO

También disponible en: davila7

Los investigadores necesitan acceso eficiente a conjuntos de datos de expresión génica para su análisis. Esta habilidad permite consultar, descargar y analizar datos de la base de datos GEO de NCBI que contiene millones de muestras genómicas.

Soporta: Claude Codex Code(CC)
⚠️ 68 Deficiente
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "geo-database". Search for diabetes gene expression datasets in humans

Resultado esperado:

  • Se encontraron 1,247 conjuntos de datos que coinciden con 'diabetes AND Homo sapiens'
  • Resultados principales:
  • - GSE12345: Expresión génica en diabetes tipo 2 (47 muestras)
  • - GSE67890: Estudio de nefropatía diabética (32 muestras)
  • - GSE11111: Curso temporal de respuesta a la insulina (24 muestras)

Usando "geo-database". Download GSE12345 and extract metadata

Resultado esperado:

  • Descargado GSE12345_series_matrix.txt.gz (145 MB)
  • Resumen del conjunto de datos:
  • - Título: Perfilado del transcriptoma de riñón diabético vs normal
  • - Muestras: 20 (10 diabéticas, 10 control)
  • - Plataforma: GPL570 (Affymetrix Human Genome U133 Plus 2.0)
  • - Organismo: Homo sapiens
  • - Fecha de envío: 2023-06-15

Auditoría de seguridad

Riesgo bajo
v4 • 1/17/2026

Documentation-only skill for accessing NCBI GEO database. Static analysis flagged 256 pattern-based issues but all are false positives. The 'backtick execution' findings are markdown code block syntax, not actual shell commands. Network operations are legitimate NCBI API access. FTP downloads target public GEO data repositories. Optional API key usage follows NCBI best practices. No executable code present - only documentation.

3
Archivos escaneados
1,878
Líneas analizadas
3
hallazgos
4
Auditorías totales

Factores de riesgo

Puntuación de calidad

41
Arquitectura
100
Mantenibilidad
87
Contenido
29
Comunidad
90
Seguridad
74
Cumplimiento de la especificación

Lo que puedes crear

Analizar la expresión génica en enfermedades

Descargar y comparar datos de expresión génica entre muestras de tejido sano y enfermo para identificar biomarcadores.

Metaanálisis entre estudios

Combinar datos de múltiples estudios GEO para aumentar la potencia estadística al detectar cambios de expresión génica.

Construir modelos predictivos

Usar datos de expresión de GEO para entrenar modelos de aprendizaje automático para la predicción de respuesta a fármacos o la estratificación de pacientes.

Prueba estos prompts

Buscar conjuntos de datos GEO
Search GEO for human breast cancer gene expression datasets from the last 5 years. Show the top 5 results with sample counts and platforms used.
Descargar datos de expresión
Download the expression matrix and metadata for GSE12345. Save the files to ./data/ and show a summary of the dataset including number of samples and genes.
Expresión diferencial
Perform differential expression analysis on GSE12345 comparing treatment vs control samples. Use limma or t-test and show the top 10 most significant genes.
Procesamiento por lotes
Download and process these 3 GEO series: GSE100001, GSE100002, GSE100003. Extract expression data and create a summary table with study metadata.

Mejores prácticas

  • Establece siempre tu correo electrónico al usar NCBI E-utilities (requerido por la política de NCBI)
  • Obtén una clave de API gratuita de NCBI para aumentar los límites de tasa (10 req/s vs 3 req/s)
  • Almacena en caché los archivos GEO descargados localmente para evitar descargas repetidas

Evitar

  • No descargues toda la base de datos GEO: sé selectivo con los accesos
  • No codifiques claves de API en código compartido o bajo control de versiones
  • No ignores los metadatos de las muestras al interpretar los datos de expresión

Preguntas frecuentes

¿Necesito una clave de API para acceder a GEO?
La clave de API es opcional pero recomendada. Sin clave: 3 solicitudes por segundo. Con clave: 10 solicitudes por segundo. Obtén una clave gratuita en ncbi.nlm.nih.gov/account/
¿Cuál es la diferencia entre GSE, GSM y GPL?
GSE es el estudio completo (serie), GSM es una muestra individual, GPL es la plataforma de microarreglos o secuenciación. Usa GSE para conjuntos de datos completos.
¿Por qué faltan datos de expresión en algunas series?
Las presentaciones antiguas pueden carecer de archivos de matriz. Descarga el archivo SOFT familiar o analiza tablas de muestras individuales para obtener datos completos.
¿Cómo manejo conjuntos de datos GEO muy grandes?
Usa descargas FTP para datos masivos, procesa por bloques y usa matrices dispersas para eficiencia de memoria con datos de expresión dispersos.
¿Puedo usar datos de GEO para investigación clínica?
Sí, los datos de GEO son de dominio público. Siempre cita los estudios originales y verifica la calidad de los datos antes de aplicaciones clínicas.
¿Qué formato de archivo debo usar para datos de expresión?
Los archivos de matriz de series son los más rápidos para valores de expresión. Usa SOFT para metadatos completos. Usa MINiML para necesidades de procesamiento basadas en XML.

Detalles del desarrollador

Estructura de archivos