Compétences scikit-bio
🧬

scikit-bio

Sûr ⚙️ Commandes externes🌐 Accès réseau

Analyser des données biologiques avec scikit-bio

Également disponible depuis: davila7

Traiter les séquences biologiques, calculer les métriques de diversité et effectuer des tests statistiques sur les données microbiologiques et écologiques. Cette compétence fournit des conseils complets pour les flux de travail de bioinformatique, notamment l'alignement de séquences, l'analyse phylogénétique et l'ordonnance.

Prend en charge: Claude Codex Code(CC)
📊 69 Adéquat
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "scikit-bio". Calculer les métriques de diversité à partir de mon tableau OTU

Résultat attendu:

  • Lire ton tableau BIOM : Table.read('table.biom')
  • Calculer la diversité alpha : alpha_diversity('shannon', counts, ids=sample_ids)
  • Calculer la diversité bêta : beta_diversity('braycurtis', counts, ids=sample_ids)
  • Exécuter PERMANOVA : permanova(distance_matrix, grouping, permutations=999)

Utilisation de "scikit-bio". Construire un arbre phylogénétique à partir de mes séquences

Résultat attendu:

  • Lire les séquences depuis FASTA : skbio.DNA.read('sequences.fasta')
  • Calculer la matrice de distances : seq1.distance(seq2) ou utiliser kmer_distance
  • Construire l'arbre avec NJ : nj(distance_matrix)
  • Calculer la distance de Robinson-Foulds : tree.robinson_foulds(other_tree)

Audit de sécurité

Sûr
v4 • 1/17/2026

Documentation-only skill with no executable code. All 133 static findings are false positives: detected backticks are markdown code delimiters, C2 keywords are scientific abbreviations (PC1, CCA, RDA for ordination methods), weak crypto flags are biological substitution matrices (BLOSUM62 for protein alignments), and URLs are official documentation links. No command injection, network exfiltration, or malicious patterns exist.

3
Fichiers analysés
1,393
Lignes analysées
2
résultats
4
Total des audits

Score de qualité

41
Architecture
100
Maintenabilité
87
Contenu
20
Communauté
100
Sécurité
83
Conformité aux spécifications

Ce que vous pouvez construire

Analyser la diversité du microbiome

Calculer la diversité alpha et bêta à partir de tableaux OTU et effectuer des tests PERMANOVA sur les regroupements d'échantillons.

Construire des arbres phylogénétiques

Construire des arbres à partir d'alignements de séquences et calculer les distances de Robinson-Foulds pour la comparaison d'arbres.

Traiter des données de séquences

Lire, filtrer et transformer des séquences biologiques dans plus de 19 formats de fichiers avec validation.

Essayez ces prompts

Opérations de séquences de base
Montre-moi comment lire un fichier FASTA avec skbio, calculer le complément inverse et trouver des motifs en utilisant des motifs regex.
Analyse de diversité
Guide-moi pour calculer la diversité alpha de Shannon à partir d'une matrice de comptages et calculer la diversité bêta de Bray-Curtis entre les échantillons.
Analyse phylogénétique
Aide-moi à construire un arbre phylogénétique utilisant Neighbor Joining à partir d'une matrice de distances et calculer les distances patristiques entre les taxons.
Tests statistiques
Montre-moi comment exécuter un test PERMANOVA sur une matrice de distances pour déterminer si les groupes d'échantillons diffèrent significativement, avec 999 permutations.

Bonnes pratiques

  • Utiliser les générateurs (skbio.io.read) pour les gros fichiers de séquences pour éviter les problèmes de mémoire
  • Intégrer avec pandas et numpy pour l'analyse en aval et la visualisation
  • Valider que les identifiants de séquences correspondent entre les fichiers avant les calculs de diversité

Éviter

  • Ne pas utiliser les fréquences relatives pour les comptages - convertir en entiers d'abord
  • Ne pas mélanger les arbres enracinés et non enracinés lors du calcul des distances de Robinson-Foulds
  • Ne pas sauter PERMDISP lors de l'exécution de PERMANOVA - vérifier les hypothèses de dispersion

Foire aux questions

Quels formats de fichiers scikit-bio supporte-t-il ?
FASTA, FASTQ, GenBank, EMBL, Clustal, PHYLIP, Stockholm, Newick, BIOM (HDF5/JSON) et les matrices délimitées.
Comment calculer la diversité phylogénétique ?
Utiliser alpha_diversity('faith_pd', counts, tree=tree, otu_ids=feature_ids) avec un arbre phylogénétique enraciné.
Quelle est la différence entre la diversité alpha et bêta ?
Les mesures alpha concernent la diversité au sein d'un échantillon (ex. : Shannon, Simpson), les mesures bêta concernent la dissimilitude entre échantillons (ex. : Bray-Curtis, UniFrac).
Puis-je utiliser scikit-bio avec QIIME 2 ?
Oui, scikit-bio lit et écrit des formats compatibles QIIME 2, incluant les tableaux BIOM, les arbres et les matrices de distances.
Comment gérer efficacement les gros fichiers de séquences ?
Utiliser la lecture basée sur les générateurs : for seq in skbio.io.read('large.fasta', format='fasta', constructor=skbio.DNA)
Quels tests statistiques sont disponibles pour les données écologiques ?
PERMANOVA, ANOSIM, PERMDISP, test de Mantel et Bioenv pour la sélection de variables environnementales.

Détails du développeur

Structure de fichiers