Навыки geo-database
🧬

geo-database

Низкий риск 🌐 Доступ к сети⚙️ Внешние команды📁 Доступ к файловой системе

Доступ к данным экспрессии генов NCBI GEO

Также доступно от: davila7

Исследователям необходим эффективный доступ к наборам данных экспрессии генов для анализа. Этот навык позволяет запрашивать, загружать и анализировать данные из базы данных NCBI GEO, содержащей миллионы геномных образцов.

Поддерживает: Claude Codex Code(CC)
⚠️ 68 Плохо
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «geo-database». Search for diabetes gene expression datasets in humans

Ожидаемый результат:

  • Found 1,247 datasets matching 'diabetes AND Homo sapiens'
  • Top results:
  • - GSE12345: Type 2 diabetes gene expression (47 samples)
  • - GSE67890: Diabetic nephropathy study (32 samples)
  • - GSE11111: Insulin response time course (24 samples)

Использование «geo-database». Download GSE12345 and extract metadata

Ожидаемый результат:

  • Downloaded GSE12345_series_matrix.txt.gz (145 MB)
  • Dataset summary:
  • - Title: Transcriptome profiling of diabetic vs normal kidney
  • - Samples: 20 (10 diabetic, 10 control)
  • - Platform: GPL570 (Affymetrix Human Genome U133 Plus 2.0)
  • - Organism: Homo sapiens
  • - Submission date: 2023-06-15

Аудит безопасности

Низкий риск
v4 • 1/17/2026

Documentation-only skill for accessing NCBI GEO database. Static analysis flagged 256 pattern-based issues but all are false positives. The 'backtick execution' findings are markdown code block syntax, not actual shell commands. Network operations are legitimate NCBI API access. FTP downloads target public GEO data repositories. Optional API key usage follows NCBI best practices. No executable code present - only documentation.

3
Просканировано файлов
1,878
Проанализировано строк
3
находки
4
Всего аудитов

Факторы риска

🌐 Доступ к сети (3)
⚙️ Внешние команды (3)
📁 Доступ к файловой системе (1)

Оценка качества

41
Архитектура
100
Сопровождаемость
87
Контент
29
Сообщество
90
Безопасность
74
Соответствие спецификации

Что вы можете построить

Анализ экспрессии генов при заболеваниях

Загрузите и сравните данные экспрессии генов между здоровыми и больными тканевыми образцами для выявления биомаркеров.

Метаанализ по исследованиям

Объедините данные из нескольких исследований GEO для увеличения статистической мощности при обнаружении изменений экспрессии генов.

Построение предиктивных моделей

Используйте данные экспрессии GEO для обучения моделей машинного обучения для прогнозирования ответа на препараты или стратификации пациентов.

Попробуйте эти промпты

Поиск наборов данных GEO
Search GEO for human breast cancer gene expression datasets from the last 5 years. Show the top 5 results with sample counts and platforms used.
Загрузка данных экспрессии
Download the expression matrix and metadata for GSE12345. Save the files to ./data/ and show a summary of the dataset including number of samples and genes.
Дифференциальная экспрессия
Perform differential expression analysis on GSE12345 comparing treatment vs control samples. Use limma or t-test and show the top 10 most significant genes.
Пакетная обработка
Download and process these 3 GEO series: GSE100001, GSE100002, GSE100003. Extract expression data and create a summary table with study metadata.

Лучшие практики

  • Всегда указывайте свой email при использовании NCBI E-utilities (требуется политикой NCBI)
  • Получите бесплатный API-ключ от NCBI для увеличения лимитов скорости (10 запросов/с против 3 запросов/с)
  • Кэшируйте загруженные файлы GEO локально, чтобы избежать повторных загрузок

Избегать

  • Не загружайте всю базу данных GEO - будьте избирательны с доступными наборами
  • Не хардкодьте API-ключи в общем или версионируемом коде
  • Не игнорируйте метаданные образцов при интерпретации данных экспрессии

Часто задаваемые вопросы

Нужен ли мне API-ключ для доступа к GEO?
API-ключ необязателен, но рекомендуется. Без ключа: 3 запроса в секунду. С ключом: 10 запросов в секунду. Получите бесплатный ключ на ncbi.nlm.nih.gov/account/
В чем разница между GSE, GSM и GPL?
GSE - это полное исследование (серия), GSM - отдельный образец, GPL - платформа для микрочипов или секвенирования. Используйте GSE для полных наборов данных.
Почему данные экспрессии отсутствуют для некоторых серий?
Более старые записи могут не иметь матричных файлов. Загрузите семейный SOFT-файл или разберите отдельные таблицы образцов для полных данных.
Как обрабатывать очень большие наборы данных GEO?
Используйте FTP-загрузки для массовых данных, обрабатывайте по частям и используйте разреженные матрицы для эффективности памяти с разреженными данными экспрессии.
Могу ли я использовать данные GEO для клинических исследований?
Да, данные GEO являются общественным достоянием. Всегда цитируйте оригинальные исследования и проверяйте качество данных перед клиническим применением.
Какой формат файла следует использовать для данных экспрессии?
Файлы серийных матриц самые быстрые для значений экспрессии. Используйте SOFT для полных метаданных. Используйте MINiML для потребностей обработки на основе XML.

Сведения для разработчиков

Автор

K-Dense-AI

Лицензия

MIT

Ссылка

main

Структура файлов