Compétences exploratory-data-analysis
📊

exploratory-data-analysis

Sûr 📁 Accès au système de fichiers

Analyser automatiquement les fichiers de données scientifiques

Également disponible depuis: davila7

Les fichiers de données scientifiques existent dans des centaines de formats. Cette compétence détecte automatiquement le type de fichier, extrait les métadonnées, évalue la qualité des données et génère des rapports markdown complets avec des recommandations d'analyse spécifiques au format.

Prend en charge: Claude Codex Code(CC)
🥈 80 Argent
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "exploratory-data-analysis". Analyser data/sample.fastq

Résultat attendu:

  • Fichier : sample.fastq (24,5 Mo)
  • Format : FASTQ (données de séquence avec scores de qualité)
  • Échantillon de 10 000 lectures : Longueur moyenne 150 pb, Qualité moyenne : 35,2
  • Contenu GC : 52,3%
  • Évaluation de la qualité : Données de haute qualité, adaptées à lanalyse en aval
  • Recommandations : Procéder à lalignement ; aucun découpage requis

Utilisation de "exploratory-data-analysis". Explorer experiment_results.csv

Résultat attendu:

  • Fichier : experiment_results.csv (1,2 Mo)
  • Format : CSV (données tabulaires)
  • Dimensions : 5 000 lignes x 12 colonnes
  • Valeurs manquantes : 2,3% dans la colonne 'temperature'
  • Statistiques : Moyenne=45,2, Écart-type=12,8, Plage=[-5,2, 98,4]
  • Recommandations : Imputer les valeurs manquantes ; vérifier les valeurs aberrantes dans la colonne température

Audit de sécurité

Sûr
v4 • 1/17/2026

After thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.

10
Fichiers analysés
8,669
Lignes analysées
1
résultats
4
Total des audits

Facteurs de risque

📁 Accès au système de fichiers (1)

Score de qualité

82
Architecture
100
Maintenabilité
85
Contenu
21
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Explorer les données de séquençage génomique

Analyser les fichiers FASTQ, BAM et VCF pour comprendre la qualité des séquences, les taux de mappage et les distributions de variants.

Examiner les fichiers de structure moléculaire

Analyser les fichiers PDB, SDF et CIF pour évaluer les structures moléculaires, les coordonnées atomiques et les informations de liaisons.

Inspecter les métadonnées dimages de microscopie

Extraire les dimensions, les canaux, les horodatages et létalonnage spatial des fichiers dimages TIFF, ND2 et CZI.

Essayez ces prompts

Analyse de base
Analyser ce fichier de données scientifique au chemin : <filepath>
Avec rapport
Générer un rapport EDA complet pour ce fichier et lenregistrer dans <filepath>
Focus qualité
Effectuer une évaluation de la qualité des données sur ce fichier et identifier tout problème ou anomalie.
Multi-fichiers
Analyser ces fichiers liés multiples et créer un rapport de comparaison synthétique.

Bonnes pratiques

  • Fournir le chemin complet du fichier lors de la demande danalyse pour une détection précise
  • Spécifier le nom du fichier de sortie pour générer un rapport markdown persistant
  • Vérifier les bibliothèques Python requises pour les formats spécialisés avant lanalyse

Éviter

  • Ne pas demander à la compétence de modifier ou décrire dans les fichiers de données sources
  • Ne pas sattendre à ce que la compétence effectue une modélisation statistique avancée
  • Ne pas supposer que la compétence peut interpréter la signification biologique des séquences

Foire aux questions

Quels formats de fichiers sont pris en charge ?
Plus de 200 formats, notamment FASTQ, BAM, VCF, PDB, CIF, TIFF, ND2, CSV, HDF5, et bien dautres.
Cela modifie-t-il mes fichiers de données ?
Non, la compétence lit uniquement les fichiers et génère de nouveaux rapports markdown sans modifier les données dorigine.
Quest-ce que le rapport généré inclut ?
Métadonnées du fichier, détails du format, résumés statistiques, métriques de qualité et recommandations danalyse en aval.
Peut-il analyser des fichiers volumineux ?
Oui, mais les fichiers très volumineux peuvent être échantillonnés pour des raisons de performance. Le rapport indique quand un échantillonnage est utilisé.
Quelles bibliothèques Python sont requises ?
Bibliothèques principales : pandas, numpy. Spécifiques au format : Biopython pour les séquences, h5py pour HDF5, Pillow pour les images.
Peut-il analyser plusieurs fichiers ensemble ?
Chaque fichier est analysé séparément. Vous pouvez demander des comparaisons entre fichiers liés dans la même demande danalyse.