scikit-bio
Analyser des données biologiques avec scikit-bio
Également disponible depuis: davila7
Traiter les séquences biologiques, calculer les métriques de diversité et effectuer des tests statistiques sur les données microbiologiques et écologiques. Cette compétence fournit des conseils complets pour les flux de travail de bioinformatique, notamment l'alignement de séquences, l'analyse phylogénétique et l'ordonnance.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "scikit-bio". Calculer les métriques de diversité à partir de mon tableau OTU
Résultat attendu:
- Lire ton tableau BIOM : Table.read('table.biom')
- Calculer la diversité alpha : alpha_diversity('shannon', counts, ids=sample_ids)
- Calculer la diversité bêta : beta_diversity('braycurtis', counts, ids=sample_ids)
- Exécuter PERMANOVA : permanova(distance_matrix, grouping, permutations=999)
Utilisation de "scikit-bio". Construire un arbre phylogénétique à partir de mes séquences
Résultat attendu:
- Lire les séquences depuis FASTA : skbio.DNA.read('sequences.fasta')
- Calculer la matrice de distances : seq1.distance(seq2) ou utiliser kmer_distance
- Construire l'arbre avec NJ : nj(distance_matrix)
- Calculer la distance de Robinson-Foulds : tree.robinson_foulds(other_tree)
Audit de sécurité
SûrDocumentation-only skill with no executable code. All 133 static findings are false positives: detected backticks are markdown code delimiters, C2 keywords are scientific abbreviations (PC1, CCA, RDA for ordination methods), weak crypto flags are biological substitution matrices (BLOSUM62 for protein alignments), and URLs are official documentation links. No command injection, network exfiltration, or malicious patterns exist.
Facteurs de risque
⚙️ Commandes externes (5)
🌐 Accès réseau (1)
Score de qualité
Ce que vous pouvez construire
Analyser la diversité du microbiome
Calculer la diversité alpha et bêta à partir de tableaux OTU et effectuer des tests PERMANOVA sur les regroupements d'échantillons.
Construire des arbres phylogénétiques
Construire des arbres à partir d'alignements de séquences et calculer les distances de Robinson-Foulds pour la comparaison d'arbres.
Traiter des données de séquences
Lire, filtrer et transformer des séquences biologiques dans plus de 19 formats de fichiers avec validation.
Essayez ces prompts
Montre-moi comment lire un fichier FASTA avec skbio, calculer le complément inverse et trouver des motifs en utilisant des motifs regex.
Guide-moi pour calculer la diversité alpha de Shannon à partir d'une matrice de comptages et calculer la diversité bêta de Bray-Curtis entre les échantillons.
Aide-moi à construire un arbre phylogénétique utilisant Neighbor Joining à partir d'une matrice de distances et calculer les distances patristiques entre les taxons.
Montre-moi comment exécuter un test PERMANOVA sur une matrice de distances pour déterminer si les groupes d'échantillons diffèrent significativement, avec 999 permutations.
Bonnes pratiques
- Utiliser les générateurs (skbio.io.read) pour les gros fichiers de séquences pour éviter les problèmes de mémoire
- Intégrer avec pandas et numpy pour l'analyse en aval et la visualisation
- Valider que les identifiants de séquences correspondent entre les fichiers avant les calculs de diversité
Éviter
- Ne pas utiliser les fréquences relatives pour les comptages - convertir en entiers d'abord
- Ne pas mélanger les arbres enracinés et non enracinés lors du calcul des distances de Robinson-Foulds
- Ne pas sauter PERMDISP lors de l'exécution de PERMANOVA - vérifier les hypothèses de dispersion
Foire aux questions
Quels formats de fichiers scikit-bio supporte-t-il ?
Comment calculer la diversité phylogénétique ?
Quelle est la différence entre la diversité alpha et bêta ?
Puis-je utiliser scikit-bio avec QIIME 2 ?
Comment gérer efficacement les gros fichiers de séquences ?
Quels tests statistiques sont disponibles pour les données écologiques ?
Détails du développeur
Structure de fichiers