exploratory-data-analysis
Analizar archivos de datos científicos automáticamente
También disponible en: davila7
Los archivos de datos científicos vienen en cientos de formatos. Esta habilidad detecta automáticamente el tipo de archivo, extrae metadatos, evalúa la calidad de los datos y genera informes completos en markdown con recomendaciones de análisis específicas por formato.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "exploratory-data-analysis". Analyze data/sample.fastq
Resultado esperado:
- File: sample.fastq (24.5 MB)
- Format: FASTQ (sequence data with quality scores)
- Sampled 10,000 reads: Mean length 150bp, Mean quality: 35.2
- GC Content: 52.3%
- Quality Assessment: High-quality data, suitable for downstream analysis
- Recommendations: Proceed with alignment; no trimming required
Usando "exploratory-data-analysis". Explore experiment_results.csv
Resultado esperado:
- File: experiment_results.csv (1.2 MB)
- Format: CSV (tabular data)
- Dimensions: 5,000 rows x 12 columns
- Missing Values: 2.3% in column 'temperature'
- Statistics: Mean=45.2, Std=12.8, Range=[-5.2, 98.4]
- Recommendations: Impute missing values; check for outliers in temperature column
Auditoría de seguridad
SeguroAfter thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.
Factores de riesgo
📁 Acceso al sistema de archivos (1)
Puntuación de calidad
Lo que puedes crear
Explorar datos de secuenciación genómica
Analiza archivos FASTQ, BAM y VCF para comprender la calidad de secuencia, las tasas de mapeo y las distribuciones de variantes.
Examinar archivos de estructura molecular
Analiza archivos PDB, SDF y CIF para evaluar estructuras moleculares, coordenadas atómicas e información de enlaces.
Inspeccionar metadatos de imágenes de microscopía
Extrae dimensiones, canales, marcas de tiempo y calibración espacial de archivos de imagen TIFF, ND2 y CZI.
Prueba estos prompts
Analyze this scientific data file at path: <filepath>
Generate a comprehensive EDA report for this file and save it to <filepath>
Perform a data quality assessment on this file and identify any issues or anomalies.
Analyze these multiple related files and create a summary comparison report.
Mejores prácticas
- Proporciona la ruta completa del archivo al solicitar el análisis para una detección precisa
- Especifica el nombre del archivo de salida para generar un informe persistente en markdown
- Verifica las bibliotecas de Python requeridas para formatos especializados antes del análisis
Evitar
- No pidas a la habilidad que modifique o escriba de vuelta en los archivos de datos fuente
- No esperes que la habilidad realice modelado estadístico avanzado
- No asumas que la habilidad puede interpretar el significado biológico a partir de secuencias
Preguntas frecuentes
¿Qué formatos de archivo son compatibles?
¿Esto modifica mis archivos de datos?
¿Qué incluye el informe generado?
¿Puede analizar archivos grandes?
¿Qué bibliotecas de Python se requieren?
¿Puede analizar múltiples archivos juntos?
Detalles del desarrollador
Autor
K-Dense-AILicencia
MIT license
Repositorio
https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/exploratory-data-analysisRef.
main
Estructura de archivos