🧬

scikit-bio

Name: scikit-bio
Author: K-Dense-AI

Sûr ⚙️ Commandes externes🌐 Accès réseau

Analyser des données biologiques avec scikit-bio

Également disponible depuis: davila7

Traiter les séquences biologiques, calculer les métriques de diversité et effectuer des tests statistiques sur les données microbiologiques et écologiques. Cette compétence fournit des conseils complets pour les flux de travail de bioinformatique, notamment l'alignement de séquences, l'analyse phylogénétique et l'ordonnance.

Prend en charge: Claude Codex Code(CC)

📊 69 Adéquat

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "scikit-bio". Calculer les métriques de diversité à partir de mon tableau OTU

Résultat attendu:

Lire ton tableau BIOM : Table.read('table.biom')
Calculer la diversité alpha : alpha_diversity('shannon', counts, ids=sample_ids)
Calculer la diversité bêta : beta_diversity('braycurtis', counts, ids=sample_ids)
Exécuter PERMANOVA : permanova(distance_matrix, grouping, permutations=999)

Utilisation de "scikit-bio". Construire un arbre phylogénétique à partir de mes séquences

Résultat attendu:

Lire les séquences depuis FASTA : skbio.DNA.read('sequences.fasta')
Calculer la matrice de distances : seq1.distance(seq2) ou utiliser kmer_distance
Construire l'arbre avec NJ : nj(distance_matrix)
Calculer la distance de Robinson-Foulds : tree.robinson_foulds(other_tree)

Audit de sécurité

Sûr

v4 • 1/17/2026

Documentation-only skill with no executable code. All 133 static findings are false positives: detected backticks are markdown code delimiters, C2 keywords are scientific abbreviations (PC1, CCA, RDA for ordination methods), weak crypto flags are biological substitution matrices (BLOSUM62 for protein alignments), and URLs are official documentation links. No command injection, network exfiltration, or malicious patterns exist.

Fichiers analysés

1,393

Lignes analysées

résultats

Total des audits

Facteurs de risque

⚙️ Commandes externes (5)

SKILL.md:44-61 SKILL.md:64-65 SKILL.md:78-81 references/api_reference.md:20-35 references/api_reference.md:39-52

🌐 Accès réseau (1)

SKILL.md:432-434

Audité par: claude Voir l’historique des audits →

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Analyser la diversité du microbiome

Calculer la diversité alpha et bêta à partir de tableaux OTU et effectuer des tests PERMANOVA sur les regroupements d'échantillons.

Construire des arbres phylogénétiques

Construire des arbres à partir d'alignements de séquences et calculer les distances de Robinson-Foulds pour la comparaison d'arbres.

Traiter des données de séquences

Lire, filtrer et transformer des séquences biologiques dans plus de 19 formats de fichiers avec validation.

Essayez ces prompts

Opérations de séquences de base

Montre-moi comment lire un fichier FASTA avec skbio, calculer le complément inverse et trouver des motifs en utilisant des motifs regex.

Analyse de diversité

Guide-moi pour calculer la diversité alpha de Shannon à partir d'une matrice de comptages et calculer la diversité bêta de Bray-Curtis entre les échantillons.

Analyse phylogénétique

Aide-moi à construire un arbre phylogénétique utilisant Neighbor Joining à partir d'une matrice de distances et calculer les distances patristiques entre les taxons.

Tests statistiques

Montre-moi comment exécuter un test PERMANOVA sur une matrice de distances pour déterminer si les groupes d'échantillons diffèrent significativement, avec 999 permutations.

Bonnes pratiques

Utiliser les générateurs (skbio.io.read) pour les gros fichiers de séquences pour éviter les problèmes de mémoire
Intégrer avec pandas et numpy pour l'analyse en aval et la visualisation
Valider que les identifiants de séquences correspondent entre les fichiers avant les calculs de diversité

Éviter

Ne pas utiliser les fréquences relatives pour les comptages - convertir en entiers d'abord
Ne pas mélanger les arbres enracinés et non enracinés lors du calcul des distances de Robinson-Foulds
Ne pas sauter PERMDISP lors de l'exécution de PERMANOVA - vérifier les hypothèses de dispersion

Foire aux questions

Quels formats de fichiers scikit-bio supporte-t-il ?

FASTA, FASTQ, GenBank, EMBL, Clustal, PHYLIP, Stockholm, Newick, BIOM (HDF5/JSON) et les matrices délimitées.

Comment calculer la diversité phylogénétique ?

Utiliser alpha_diversity('faith_pd', counts, tree=tree, otu_ids=feature_ids) avec un arbre phylogénétique enraciné.

Quelle est la différence entre la diversité alpha et bêta ?

Les mesures alpha concernent la diversité au sein d'un échantillon (ex. : Shannon, Simpson), les mesures bêta concernent la dissimilitude entre échantillons (ex. : Bray-Curtis, UniFrac).

Puis-je utiliser scikit-bio avec QIIME 2 ?

Oui, scikit-bio lit et écrit des formats compatibles QIIME 2, incluant les tableaux BIOM, les arbres et les matrices de distances.

Comment gérer efficacement les gros fichiers de séquences ?

Utiliser la lecture basée sur les générateurs : for seq in skbio.io.read('large.fasta', format='fasta', constructor=skbio.DNA)

Quels tests statistiques sont disponibles pour les données écologiques ?

PERMANOVA, ANOSIM, PERMDISP, test de Mantel et Bioenv pour la sélection de variables environnementales.