ena-database
Запрос данных из Европейского архива нуклеотидов
Auch verfügbar von: davila7
Исследователям необходим эффективный доступ к геномным данным для анализа. Этот навык обеспечивает программный доступ к ENA через REST API и FTP для получения последовательностей ДНК/РНК, файлов FASTQ и сборок геномов по регистрационным номерам.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "ena-database". Find assemblies for SARS-CoV-2 with assembly level chromosome
Erwartetes Ergebnis:
Найдено 5 сборок, соответствующих критериям:
- ERR1234567: Complete Genome (MN908947.3)
- ERR2345678: Complete Genome (MW123456.1)
- ERR3456789: Assembly Level: chromosome
Доступ к последовательностям: https://www.ebi.ac.uk/ena/browser/api/xml/[ACCESSION]
Verwendung von "ena-database". Get taxonomy for Escherichia coli
Erwartetes Ergebnis:
Taxonomy ID: 562
Научное название: Escherichia coli
Линейность: Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia
Ранг: Species
Verwendung von "ena-database". Search for RNA-seq experiments in study PRJEB12345
Erwartetes Ergebnis:
Найдено 12 экспериментов RNA-seq:
- ERX123456: Paired-end, ILLUMINA
- ERX123457: Single-end, ILLUMINA
- ERX123458: Paired-end, BGI
Регистрационные номера прогонов доступны для загрузки FASTQ.
Sicherheitsaudit
Niedriges RisikoThis is a legitimate bioinformatics data access skill for querying the European Nucleotide Archive. All static findings are false positives. The 'external_commands' detections are backtick characters in documentation examples, not shell execution. 'Network' findings are HTTP requests to public ENA APIs (www.ebi.ac.uk). Critical/high severity flags (SAM database, C2 keywords, weak crypto) match generic terms in documentation (sample=sam, MD5/SHA1 for checksums). No actual security risks present.
Risikofaktoren
🌐 Netzwerkzugriff (2)
📁 Dateisystemzugriff (1)
Qualitätsbewertung
Was du bauen kannst
Получение данных секвенирования для анализа
Загрузка необработанных файлов FASTQ и сборок геномов по регистрационному номеру для последующих конвейеров биоинформатического анализа.
Поиск наборов данных по исследованию или организму
Запрос к ENA Portal API для поиска всех образцов, прогонов или сборок, связанных с конкретным исследованием или таксономической классификацией.
Построение воспроизводимых исследовательских рабочих процессов
Интеграция получения данных ENA в автоматизированные конвейеры, которые извлекают и цитируют конкретные регистрационные номера для воспроизводимых геномных исследований.
Probiere diese Prompts
Use the ENA Portal API to search for all samples in study PRJNA[STUDY_ID]. Return the accession numbers and sample titles.
Retrieve the nucleotide sequence for accession [ACCESSION] in FASTA format using the ENA Browser API.
Find all assemblies for [ORGANISM] with contig N50 >= [N50_VALUE] using the ENA Portal API.
Search for all read runs in study [STUDY_ID], extract the FTP URLs, and generate a script to download all files via FTP.
Bewährte Verfahren
- Реализуйте ограничение скорости с экспоненциальной задержкой, чтобы оставаться в пределах 50 запросов в секунду
- Используйте FTP или Aspera для загрузки файлов размером более 100 МБ
- Цитируйте регистрационные номера исследований и образцов при публикации результатов, полученных из данных ENA
Vermeiden
- Выполнение отдельных вызовов API для тысяч записей вместо пакетной обработки
- Загрузка больших файлов через HTTP, когда доступны FTP/Aspera
- Неспособность обработать ошибки парсинга XML из ответов ENA Browser API
Häufig gestellte Fragen
В чем разница между ENA Portal API и Browser API?
Как загрузить большие файлы FASTQ?
В каких форматах я могу получить последовательности?
Как найти все данные из конкретного исследования?
Каковы ограничения скорости для API ENA?
Как цитировать данные ENA в моей публикации?
Entwicklerdetails
Autor
K-Dense-AILizenz
Unknown
Repository
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/ena-databaseRef
main
Dateistruktur