ena-database
Consultar European Nucleotide Archive
Auch verfügbar von: davila7
Los investigadores necesitan acceso eficiente a datos genómicos para análisis. Esta habilidad proporciona acceso programático a ENA a través de APIs REST y FTP para recuperar secuencias de ADN/ARN, archivos FASTQ y ensamblajes de genomas por número de acceso.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "ena-database". Find assemblies for SARS-CoV-2 with assembly level chromosome
Erwartetes Ergebnis:
Se encontraron 5 ensamblajes que coinciden con los criterios:
- ERR1234567: Complete Genome (MN908947.3)
- ERR2345678: Complete Genome (MW123456.1)
- ERR3456789: Assembly Level: chromosome
Acceda a las secuencias en: https://www.ebi.ac.uk/ena/browser/api/xml/[ACCESSION]
Verwendung von "ena-database". Get taxonomy for Escherichia coli
Erwartetes Ergebnis:
Taxonomy ID: 562
Scientific Name: Escherichia coli
Lineage: Bacteria; Proteobacteria; Gammaproteobacteria; Enterobacterales; Enterobacteriaceae; Escherichia
Rank: Species
Verwendung von "ena-database". Search for RNA-seq experiments in study PRJEB12345
Erwartetes Ergebnis:
Se encontraron 12 experimentos RNA-seq:
- ERX123456: Paired-end, ILLUMINA
- ERX123457: Single-end, ILLUMINA
- ERX123458: Paired-end, BGI
Números de acceso de ejecución disponibles para descarga FASTQ.
Sicherheitsaudit
Niedriges RisikoThis is a legitimate bioinformatics data access skill for querying the European Nucleotide Archive. All static findings are false positives. The 'external_commands' detections are backtick characters in documentation examples, not shell execution. 'Network' findings are HTTP requests to public ENA APIs (www.ebi.ac.uk). Critical/high severity flags (SAM database, C2 keywords, weak crypto) match generic terms in documentation (sample=sam, MD5/SHA1 for checksums). No actual security risks present.
Risikofaktoren
🌐 Netzwerkzugriff (2)
📁 Dateisystemzugriff (1)
Qualitätsbewertung
Was du bauen kannst
Recuperar datos de secuenciación para análisis
Descargar archivos FASTQ en bruto y ensamblajes de genomas por número de acceso para análisis posteriores en pipelines de bioinformática.
Buscar conjuntos de datos por estudio u organismo
Consultar la API del Portal ENA para encontrar todas las muestras, ejecuciones o ensamblajes asociados con un estudio específico o clasificación taxonómica.
Construir flujos de trabajo de investigación reproducibles
Integrar la recuperación de datos de ENA en pipelines automatizados que obtienen y citan accesos específicos para investigación genómica reproducible.
Probiere diese Prompts
Use the ENA Portal API to search for all samples in study PRJNA[STUDY_ID]. Return the accession numbers and sample titles.
Retrieve the nucleotide sequence for accession [ACCESSION] in FASTA format using the ENA Browser API.
Find all assemblies for [ORGANISM] with contig N50 >= [N50_VALUE] using the ENA Portal API.
Search for all read runs in study [STUDY_ID], extract the FTP URLs, and generate a script to download all files via FTP.
Bewährte Verfahren
- Implementar limitación de tasa con retroceso exponencial para mantenerse dentro de 50 solicitudes por segundo
- Usar FTP o Aspera para descargar archivos mayores de 100MB
- Citar números de acceso de estudios y muestras al publicar resultados derivados de datos de ENA
Vermeiden
- Realizar llamadas API individuales para miles de registros en lugar de procesarlos por lotes
- Descargar archivos grandes mediante HTTP cuando FTP/Aspera está disponible
- No manejar errores de análisis XML de las respuestas de la API Browser de ENA
Häufig gestellte Fragen
¿Cuál es la diferencia entre la API del Portal ENA y la API Browser?
¿Cómo descargo archivos FASTQ grandes?
¿En qué formatos puedo recuperar secuencias?
¿Cómo encuentro todos los datos de un estudio específico?
¿Cuáles son los límites de tasa para las APIs de ENA?
¿Cómo cito datos de ENA en mi publicación?
Entwicklerdetails
Autor
K-Dense-AILizenz
Unknown
Repository
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/ena-databaseRef
main
Dateistruktur