geo-database
Доступ к данным экспрессии генов NCBI GEO
Также доступно от: davila7
Исследователям необходим эффективный доступ к наборам данных экспрессии генов для анализа. Этот навык позволяет запрашивать, загружать и анализировать данные из базы данных NCBI GEO, содержащей миллионы геномных образцов.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «geo-database». Search for diabetes gene expression datasets in humans
Ожидаемый результат:
- Found 1,247 datasets matching 'diabetes AND Homo sapiens'
- Top results:
- - GSE12345: Type 2 diabetes gene expression (47 samples)
- - GSE67890: Diabetic nephropathy study (32 samples)
- - GSE11111: Insulin response time course (24 samples)
Использование «geo-database». Download GSE12345 and extract metadata
Ожидаемый результат:
- Downloaded GSE12345_series_matrix.txt.gz (145 MB)
- Dataset summary:
- - Title: Transcriptome profiling of diabetic vs normal kidney
- - Samples: 20 (10 diabetic, 10 control)
- - Platform: GPL570 (Affymetrix Human Genome U133 Plus 2.0)
- - Organism: Homo sapiens
- - Submission date: 2023-06-15
Аудит безопасности
Низкий рискDocumentation-only skill for accessing NCBI GEO database. Static analysis flagged 256 pattern-based issues but all are false positives. The 'backtick execution' findings are markdown code block syntax, not actual shell commands. Network operations are legitimate NCBI API access. FTP downloads target public GEO data repositories. Optional API key usage follows NCBI best practices. No executable code present - only documentation.
Факторы риска
🌐 Доступ к сети (3)
⚙️ Внешние команды (3)
📁 Доступ к файловой системе (1)
Оценка качества
Что вы можете построить
Анализ экспрессии генов при заболеваниях
Загрузите и сравните данные экспрессии генов между здоровыми и больными тканевыми образцами для выявления биомаркеров.
Метаанализ по исследованиям
Объедините данные из нескольких исследований GEO для увеличения статистической мощности при обнаружении изменений экспрессии генов.
Построение предиктивных моделей
Используйте данные экспрессии GEO для обучения моделей машинного обучения для прогнозирования ответа на препараты или стратификации пациентов.
Попробуйте эти промпты
Search GEO for human breast cancer gene expression datasets from the last 5 years. Show the top 5 results with sample counts and platforms used.
Download the expression matrix and metadata for GSE12345. Save the files to ./data/ and show a summary of the dataset including number of samples and genes.
Perform differential expression analysis on GSE12345 comparing treatment vs control samples. Use limma or t-test and show the top 10 most significant genes.
Download and process these 3 GEO series: GSE100001, GSE100002, GSE100003. Extract expression data and create a summary table with study metadata.
Лучшие практики
- Всегда указывайте свой email при использовании NCBI E-utilities (требуется политикой NCBI)
- Получите бесплатный API-ключ от NCBI для увеличения лимитов скорости (10 запросов/с против 3 запросов/с)
- Кэшируйте загруженные файлы GEO локально, чтобы избежать повторных загрузок
Избегать
- Не загружайте всю базу данных GEO - будьте избирательны с доступными наборами
- Не хардкодьте API-ключи в общем или версионируемом коде
- Не игнорируйте метаданные образцов при интерпретации данных экспрессии
Часто задаваемые вопросы
Нужен ли мне API-ключ для доступа к GEO?
В чем разница между GSE, GSM и GPL?
Почему данные экспрессии отсутствуют для некоторых серий?
Как обрабатывать очень большие наборы данных GEO?
Могу ли я использовать данные GEO для клинических исследований?
Какой формат файла следует использовать для данных экспрессии?
Сведения для разработчиков
Автор
K-Dense-AIЛицензия
MIT
Репозиторий
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/geo-databaseСсылка
main
Структура файлов