Habilidades exploratory-data-analysis
📊

exploratory-data-analysis

Seguro 📁 Acceso al sistema de archivos

Analizar archivos de datos científicos automáticamente

También disponible en: davila7

Los archivos de datos científicos vienen en cientos de formatos. Esta habilidad detecta automáticamente el tipo de archivo, extrae metadatos, evalúa la calidad de los datos y genera informes completos en markdown con recomendaciones de análisis específicas por formato.

Soporta: Claude Codex Code(CC)
🥈 80 Plata
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "exploratory-data-analysis". Analyze data/sample.fastq

Resultado esperado:

  • File: sample.fastq (24.5 MB)
  • Format: FASTQ (sequence data with quality scores)
  • Sampled 10,000 reads: Mean length 150bp, Mean quality: 35.2
  • GC Content: 52.3%
  • Quality Assessment: High-quality data, suitable for downstream analysis
  • Recommendations: Proceed with alignment; no trimming required

Usando "exploratory-data-analysis". Explore experiment_results.csv

Resultado esperado:

  • File: experiment_results.csv (1.2 MB)
  • Format: CSV (tabular data)
  • Dimensions: 5,000 rows x 12 columns
  • Missing Values: 2.3% in column 'temperature'
  • Statistics: Mean=45.2, Std=12.8, Range=[-5.2, 98.4]
  • Recommendations: Impute missing values; check for outliers in temperature column

Auditoría de seguridad

Seguro
v4 • 1/17/2026

After thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.

10
Archivos escaneados
8,669
Líneas analizadas
1
hallazgos
4
Auditorías totales

Factores de riesgo

📁 Acceso al sistema de archivos (1)

Puntuación de calidad

82
Arquitectura
100
Mantenibilidad
85
Contenido
21
Comunidad
100
Seguridad
91
Cumplimiento de la especificación

Lo que puedes crear

Explorar datos de secuenciación genómica

Analiza archivos FASTQ, BAM y VCF para comprender la calidad de secuencia, las tasas de mapeo y las distribuciones de variantes.

Examinar archivos de estructura molecular

Analiza archivos PDB, SDF y CIF para evaluar estructuras moleculares, coordenadas atómicas e información de enlaces.

Inspeccionar metadatos de imágenes de microscopía

Extrae dimensiones, canales, marcas de tiempo y calibración espacial de archivos de imagen TIFF, ND2 y CZI.

Prueba estos prompts

Análisis básico
Analyze this scientific data file at path: <filepath>
Con informe
Generate a comprehensive EDA report for this file and save it to <filepath>
Enfoque en calidad
Perform a data quality assessment on this file and identify any issues or anomalies.
Multiarquivo
Analyze these multiple related files and create a summary comparison report.

Mejores prácticas

  • Proporciona la ruta completa del archivo al solicitar el análisis para una detección precisa
  • Especifica el nombre del archivo de salida para generar un informe persistente en markdown
  • Verifica las bibliotecas de Python requeridas para formatos especializados antes del análisis

Evitar

  • No pidas a la habilidad que modifique o escriba de vuelta en los archivos de datos fuente
  • No esperes que la habilidad realice modelado estadístico avanzado
  • No asumas que la habilidad puede interpretar el significado biológico a partir de secuencias

Preguntas frecuentes

¿Qué formatos de archivo son compatibles?
Más de 200 formatos, incluidos FASTQ, BAM, VCF, PDB, CIF, TIFF, ND2, CSV, HDF5 y muchos más.
¿Esto modifica mis archivos de datos?
No, la habilidad solo lee archivos y genera nuevos informes en markdown sin alterar los datos originales.
¿Qué incluye el informe generado?
Metadatos del archivo, detalles del formato, resúmenes estadísticos, métricas de calidad y recomendaciones de análisis posteriores.
¿Puede analizar archivos grandes?
Sí, pero los archivos muy grandes pueden muestrearse por rendimiento. El informe indica cuándo se usa muestreo.
¿Qué bibliotecas de Python se requieren?
Bibliotecas base: pandas, numpy. Específicas por formato: Biopython para secuencias, h5py para HDF5, Pillow para imágenes.
¿Puede analizar múltiples archivos juntos?
Cada archivo se analiza por separado. Puedes solicitar comparaciones entre archivos relacionados en la misma solicitud de análisis.