ena-database
Consultar European Nucleotide Archive
こちらからも入手できます: davila7
Los investigadores necesitan acceso eficiente a datos genómicos para análisis. Esta habilidad proporciona acceso programático a ENA a través de APIs REST y FTP para recuperar secuencias de ADN/ARN, archivos FASTQ y ensamblajes de genomas por número de acceso.
スキルZIPをダウンロード
Claudeでアップロード
設定 → 機能 → スキル → スキルをアップロードへ移動
オンにして利用開始
テストする
「ena-database」を使用しています。 Find assemblies for SARS-CoV-2 with assembly level chromosome
期待される結果:
Se encontraron 5 ensamblajes que coinciden con los criterios:
- ERR1234567: Complete Genome (MN908947.3)
- ERR2345678: Complete Genome (MW123456.1)
- ERR3456789: Assembly Level: chromosome
Acceda a las secuencias en: https://www.ebi.ac.uk/ena/browser/api/xml/[ACCESSION]
「ena-database」を使用しています。 Get taxonomy for Escherichia coli
期待される結果:
Taxonomy ID: 562
Scientific Name: Escherichia coli
Lineage: Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia
Rank: Species
「ena-database」を使用しています。 Search for RNA-seq experiments in study PRJEB12345
期待される結果:
Se encontraron 12 experimentos RNA-seq:
- ERX123456: Paired-end, ILLUMINA
- ERX123457: Single-end, ILLUMINA
- ERX123458: Paired-end, BGI
Números de acceso de ejecución disponibles para descarga FASTQ.
セキュリティ監査
低リスクThis is a legitimate bioinformatics data access skill for querying the European Nucleotide Archive. All static findings are false positives. The 'external_commands' detections are backtick characters in documentation examples, not shell execution. 'Network' findings are HTTP requests to public ENA APIs (www.ebi.ac.uk). Critical/high severity flags (SAM database, C2 keywords, weak crypto) match generic terms in documentation (sample=sam, MD5/SHA1 for checksums). No actual security risks present.
リスク要因
🌐 ネットワークアクセス (2)
📁 ファイルシステムへのアクセス (1)
品質スコア
作れるもの
Recuperar datos de secuenciación para análisis
Descargar archivos FASTQ en bruto y ensamblajes de genomas por número de acceso para análisis posteriores en pipelines de bioinformática.
Buscar conjuntos de datos por estudio u organismo
Consultar la API del Portal ENA para encontrar todas las muestras, ejecuciones o ensamblajes asociados con un estudio específico o clasificación taxonómica.
Construir flujos de trabajo de investigación reproducibles
Integrar la recuperación de datos de ENA en pipelines automatizados que obtienen y citan accesos específicos para investigación genómica reproducible.
これらのプロンプトを試す
Use the ENA Portal API to search for all samples in study PRJNA[STUDY_ID]. Return the accession numbers and sample titles.
Retrieve the nucleotide sequence for accession [ACCESSION] in FASTA format using the ENA Browser API.
Find all assemblies for [ORGANISM] with contig N50 >= [N50_VALUE] using the ENA Portal API.
Search for all read runs in study [STUDY_ID], extract the FTP URLs, and generate a script to download all files via FTP.
ベストプラクティス
- Implementar limitación de tasa con retroceso exponencial para mantenerse dentro de 50 solicitudes por segundo
- Usar FTP o Aspera para descargar archivos mayores de 100MB
- Citar números de acceso de estudios y muestras al publicar resultados derivados de datos de ENA
回避
- Realizar llamadas API individuales para miles de registros en lugar de procesarlos por lotes
- Descargar archivos grandes mediante HTTP cuando FTP/Aspera está disponible
- No manejar errores de análisis XML de las respuestas de la API Browser de ENA
よくある質問
¿Cuál es la diferencia entre la API del Portal ENA y la API Browser?
¿Cómo descargo archivos FASTQ grandes?
¿En qué formatos puedo recuperar secuencias?
¿Cómo encuentro todos los datos de un estudio específico?
¿Cuáles son los límites de tasa para las APIs de ENA?
¿Cómo cito datos de ENA en mi publicación?
開発者の詳細
作成者
K-Dense-AIライセンス
Unknown
リポジトリ
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/ena-database参照
main
ファイル構成