Habilidades geo-database
🧬

geo-database

Baixo Risco 🌐 Acesso à rede⚙️ Comandos externos📁 Acesso ao sistema de arquivos

Acessar dados de expressão gênica do NCBI GEO

Também disponível em: davila7

Pesquisadores precisam de acesso eficiente a conjuntos de dados de expressão gênica para análise. Esta habilidade permite consultar, baixar e analisar dados do banco de dados GEO do NCBI, que contém milhões de amostras de genômica.

Suporta: Claude Codex Code(CC)
⚠️ 68 Ruim
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "geo-database". Pesquisar conjuntos de dados de expressão gênica de diabetes em humanos

Resultado esperado:

  • Encontrados 1.247 conjuntos de dados correspondentes a 'diabetes AND Homo sapiens'
  • Principais resultados:
  • - GSE12345: Expressão gênica de diabetes tipo 2 (47 amostras)
  • - GSE67890: Estudo de nefropatia diabética (32 amostras)
  • - GSE11111: Curva temporal de resposta à insulina (24 amostras)

A utilizar "geo-database". Baixar GSE12345 e extrair metadados

Resultado esperado:

  • Baixado GSE12345_series_matrix.txt.gz (145 MB)
  • Resumo do conjunto de dados:
  • - Título: Perfil transcricional de rim diabético vs normal
  • - Amostras: 20 (10 diabéticas, 10 controle)
  • - Plataforma: GPL570 (Affymetrix Human Genome U133 Plus 2.0)
  • - Organismo: Homo sapiens
  • - Data de submissão: 2023-06-15

Auditoria de Segurança

Baixo Risco
v4 • 1/17/2026

Documentation-only skill for accessing NCBI GEO database. Static analysis flagged 256 pattern-based issues but all are false positives. The 'backtick execution' findings are markdown code block syntax, not actual shell commands. Network operations are legitimate NCBI API access. FTP downloads target public GEO data repositories. Optional API key usage follows NCBI best practices. No executable code present - only documentation.

3
Arquivos analisados
1,878
Linhas analisadas
3
achados
4
Total de auditorias

Fatores de risco

Auditado por: claude Ver Histórico de Auditoria →

Pontuação de qualidade

41
Arquitetura
100
Manutenibilidade
87
Conteúdo
29
Comunidade
90
Segurança
74
Conformidade com especificações

O Que Você Pode Construir

Analisar expressão gênica em doenças

Baixar e comparar dados de expressão gênica entre amostras de tecidos saudáveis e diseased para identificar biomarcadores.

Meta-análise entre estudos

Combinar dados de múltiplos estudos GEO para aumentar o poder estatístico para detectar mudanças na expressão gênica.

Construir modelos preditivos

Usar dados de expressão do GEO para treinar modelos de aprendizado de máquina para previsão de resposta a medicamentos ou estratificação de pacientes.

Tente Estes Prompts

Pesquisar conjuntos de dados GEO
Pesquisar GEO por conjuntos de dados de expressão gênica de câncer de mama humano dos últimos 5 anos. Mostrar os 5 principais resultados com contagem de amostras e plataformas usadas.
Baixar dados de expressão
Baixar a matriz de expressão e metadados para GSE12345. Salvar os arquivos em ./data/ e mostrar um resumo do conjunto de dados incluindo número de amostras e genes.
Expressão diferencial
Realizar análise de expressão diferencial no GSE12345 comparando amostras de tratamento vs controle. Usar limma ou t-test e mostrar os 10 genes mais significativos.
Processamento em lote
Baixar e processar estas 3 séries GEO: GSE100001, GSE100002, GSE100003. Extrair dados de expressão e criar uma tabela de resumo com metadados do estudo.

Melhores Práticas

  • Sempre defina seu email ao usar NCBI E-utilities (requerido pela política do NCBI)
  • Obtenha uma chave API gratuita do NCBI para limites de taxa aumentados (10 req/s vs 3 req/s)
  • Armazene em cache os arquivos GEO baixados localmente para evitar downloads repetidos

Evitar

  • Não baixe todo o banco de dados GEO - seja seletivo com os acessos
  • Não codifique chaves API em código compartilhado ou versionado
  • Não ignore metadados de amostras ao interpretar dados de expressão

Perguntas Frequentes

Preciso de uma chave API para acessar o GEO?
A chave API é opcional, mas recomendada. Sem chave: 3 solicitações por segundo. Com chave: 10 solicitações por segundo. Obtenha a chave gratuita em ncbi.nlm.nih.gov/account/
Qual é a diferença entre GSE, GSM e GPL?
GSE é o estudo completo (série), GSM é uma amostra individual, GPL é a plataforma de microarray ou sequenciamento. Use GSE para conjuntos de dados completos.
Por que dados de expressão estão faltando para algumas séries?
Submissões mais antigas podem não ter arquivos de matriz. Baixe o arquivo SOFT da família ou analise tabelas de amostras individuais para dados completos.
Como lidar com conjuntos de dados GEO muito grandes?
Use downloads FTP para dados em massa, processe em blocos e use matrizes esparsas para eficiência de memória com dados de expressão esparsos.
Posso usar dados GEO para pesquisa clínica?
Sim, dados GEO são de domínio público. Sempre cite os estudos originais e verifique a qualidade dos dados antes de aplicações clínicas.
Qual formato de arquivo devo usar para dados de expressão?
Arquivos de matriz de série são mais rápidos para valores de expressão. Use SOFT para metadados completos. Use MINiML para necessidades de processamento baseadas em XML.

Detalhes do Desenvolvedor

Estrutura de arquivos