Compétences ena-database
🧬

ena-database

Risque faible 🌐 Accès réseau📁 Accès au système de fichiers

Interroger European Nucleotide Archive

Également disponible depuis: davila7

Les chercheurs ont besoin d'un accès efficace aux données génomiques pour l'analyse. Cette compétence fournit un accès programmatique à l'ENA via des API REST et FTP pour récupérer des séquences ADN/ARN, des fichiers FASTQ et des assemblages de génomes par numéro d'accession.

Prend en charge: Claude Codex Code(CC)
⚠️ 66 Médiocre
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "ena-database". Find assemblies for SARS-CoV-2 with assembly level chromosome

Résultat attendu:

Found 5 assemblies matching criteria:
- ERR1234567: Complete Genome (MN908947.3)
- ERR2345678: Complete Genome (MW123456.1)
- ERR3456789: Assembly Level: chromosome

Access the sequences at: https://www.ebi.ac.uk/ena/browser/api/xml/[ACCESSION]

Utilisation de "ena-database". Get taxonomy for Escherichia coli

Résultat attendu:

Taxonomy ID: 562
Scientific Name: Escherichia coli
Lineage: Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia
Rank: Species

Utilisation de "ena-database". Search for RNA-seq experiments in study PRJEB12345

Résultat attendu:

Found 12 RNA-seq experiments:
- ERX123456: Paired-end, ILLUMINA
- ERX123457: Single-end, ILLUMINA
- ERX123458: Paired-end, BGI

Run accessions available for FASTQ download.

Audit de sécurité

Risque faible
v5 • 1/21/2026

This is a legitimate bioinformatics data access skill for querying the European Nucleotide Archive. All static findings are false positives. The 'external_commands' detections are backtick characters in documentation examples, not shell execution. 'Network' findings are HTTP requests to public ENA APIs (www.ebi.ac.uk). Critical/high severity flags (SAM database, C2 keywords, weak crypto) match generic terms in documentation (sample=sam, MD5/SHA1 for checksums). No actual security risks present.

3
Fichiers analysés
3,646
Lignes analysées
2
résultats
5
Total des audits

Facteurs de risque

🌐 Accès réseau (2)
📁 Accès au système de fichiers (1)

Score de qualité

41
Architecture
90
Maintenabilité
87
Contenu
20
Communauté
90
Sécurité
83
Conformité aux spécifications

Ce que vous pouvez construire

Récupérer des données de séquençage pour l'analyse

Télécharger des fichiers FASTQ bruts et des assemblages de génomes par numéro d'accession pour les pipelines d'analyse bioinformatique en aval.

Rechercher des jeux de données par étude ou organisme

Interroger l'API ENA Portal pour trouver tous les échantillons, lectures ou assemblages associés à une étude spécifique ou une classification taxonomique.

Créer des flux de travail de recherche reproductibles

Intégrer la récupération de données ENA dans des pipelines automatisés qui récupèrent et citent des accessions spécifiques pour la recherche génomique reproductible.

Essayez ces prompts

Trouver des échantillons dans une étude
Use the ENA Portal API to search for all samples in study PRJNA[STUDY_ID]. Return the accession numbers and sample titles.
Télécharger une séquence par accession
Retrieve the nucleotide sequence for accession [ACCESSION] in FASTA format using the ENA Browser API.
Trouver des assemblages pour un organisme
Find all assemblies for [ORGANISM] with contig N50 >= [N50_VALUE] using the ENA Portal API.
Flux de travail de téléchargement en masse
Search for all read runs in study [STUDY_ID], extract the FTP URLs, and generate a script to download all files via FTP.

Bonnes pratiques

  • Implémenter une limitation du débit avec un backoff exponentiel pour rester dans la limite de 50 requêtes par seconde
  • Utiliser FTP ou Aspera pour télécharger des fichiers de plus de 100 Mo
  • Citer les accessions d'études et d'échantillons lors de la publication de résultats dérivés de données ENA

Éviter

  • Effectuer des appels API individuels pour des milliers d'enregistrements au lieu de les regrouper par lots
  • Télécharger de gros fichiers via HTTP lorsque FTP/Aspera est disponible
  • Ne pas gérer les erreurs d'analyse XML des réponses de l'API ENA Browser

Foire aux questions

Quelle est la différence entre l'API ENA Portal et l'API Browser ?
L'API Portal est destinée à la recherche et au filtrage avancés sur tous les types de données. L'API Browser est destinée à la récupération directe d'enregistrements spécifiques par accession au format XML.
Comment télécharger de gros fichiers FASTQ ?
Pour les fichiers de plus de 100 Mo, utilisez les protocoles FTP ou Aspera au lieu de HTTP. L'API ENA Portal renvoie des URL FTP dans les résultats de recherche.
Dans quels formats puis-je récupérer des séquences ?
Les séquences sont disponibles en FASTA (séquences assemblées), FASTQ (lectures brutes), XML (format natif), et TSV/JSON pour les métadonnées.
Comment trouver toutes les données d'une étude spécifique ?
Utilisez l'API Portal avec le paramètre de requête study_accession=[STUDY_ID] et le type de résultat sample, read_run ou assembly selon les besoins.
Quelles sont les limites de débit pour les API ENA ?
Toutes les API ENA sont limitées à 50 requêtes par seconde. Dépasser cette limite renvoie HTTP 429 et nécessite l'implémentation d'un backoff.
Comment citer les données ENA dans ma publication ?
Incluez l'accession de l'étude/projet comme citation principale. Listez également les accessions spécifiques d'échantillons, de lectures ou d'assemblages utilisés dans votre analyse.

Détails du développeur

Structure de fichiers