exploratory-data-analysis
Analyser automatiquement les fichiers de données scientifiques
Également disponible depuis: davila7
Les fichiers de données scientifiques existent dans des centaines de formats. Cette compétence détecte automatiquement le type de fichier, extrait les métadonnées, évalue la qualité des données et génère des rapports markdown complets avec des recommandations d'analyse spécifiques au format.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "exploratory-data-analysis". Analyser data/sample.fastq
Résultat attendu:
- Fichier : sample.fastq (24,5 Mo)
- Format : FASTQ (données de séquence avec scores de qualité)
- Échantillon de 10 000 lectures : Longueur moyenne 150 pb, Qualité moyenne : 35,2
- Contenu GC : 52,3%
- Évaluation de la qualité : Données de haute qualité, adaptées à lanalyse en aval
- Recommandations : Procéder à lalignement ; aucun découpage requis
Utilisation de "exploratory-data-analysis". Explorer experiment_results.csv
Résultat attendu:
- Fichier : experiment_results.csv (1,2 Mo)
- Format : CSV (données tabulaires)
- Dimensions : 5 000 lignes x 12 colonnes
- Valeurs manquantes : 2,3% dans la colonne 'temperature'
- Statistiques : Moyenne=45,2, Écart-type=12,8, Plage=[-5,2, 98,4]
- Recommandations : Imputer les valeurs manquantes ; vérifier les valeurs aberrantes dans la colonne température
Audit de sécurité
SûrAfter thorough evaluation of 1077 static findings, all are false positives. The scanner misinterpreted Markdown code formatting (backticks) as shell commands, bioinformatics format names (SAM) as Windows credentials, and documentation references to file format specifications as weak cryptography. The skill is a legitimate scientific data analysis tool that only reads data files and writes markdown reports. No network access, no command execution, and no sensitive data handling were found.
Facteurs de risque
📁 Accès au système de fichiers (1)
Score de qualité
Ce que vous pouvez construire
Explorer les données de séquençage génomique
Analyser les fichiers FASTQ, BAM et VCF pour comprendre la qualité des séquences, les taux de mappage et les distributions de variants.
Examiner les fichiers de structure moléculaire
Analyser les fichiers PDB, SDF et CIF pour évaluer les structures moléculaires, les coordonnées atomiques et les informations de liaisons.
Inspecter les métadonnées dimages de microscopie
Extraire les dimensions, les canaux, les horodatages et létalonnage spatial des fichiers dimages TIFF, ND2 et CZI.
Essayez ces prompts
Analyser ce fichier de données scientifique au chemin : <filepath>
Générer un rapport EDA complet pour ce fichier et lenregistrer dans <filepath>
Effectuer une évaluation de la qualité des données sur ce fichier et identifier tout problème ou anomalie.
Analyser ces fichiers liés multiples et créer un rapport de comparaison synthétique.
Bonnes pratiques
- Fournir le chemin complet du fichier lors de la demande danalyse pour une détection précise
- Spécifier le nom du fichier de sortie pour générer un rapport markdown persistant
- Vérifier les bibliothèques Python requises pour les formats spécialisés avant lanalyse
Éviter
- Ne pas demander à la compétence de modifier ou décrire dans les fichiers de données sources
- Ne pas sattendre à ce que la compétence effectue une modélisation statistique avancée
- Ne pas supposer que la compétence peut interpréter la signification biologique des séquences