🧬

pysam

Sûr ⚙️ Commandes externes📁 Accès au système de fichiers

Travailler avec des fichiers de séquençage génomique

Également disponible depuis: davila7

Traitez et analysez des données de séquençage ADN avec des outils pour lire les fichiers BAM, VCF et FASTQ. Extrayez les régions génomiques, calculez les statistiques de couverture et intégrez plusieurs types de fichiers pour une analyse complète des variants.

Prend en charge: Claude Codex Code(CC)
📊 71 Adéquat
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "pysam". Ouvrir un fichier BAM et afficher les statistiques de couverture pour le chromosome 1

Résultat attendu:

  • Statistiques du chromosome 1 :
  • Lectures totales : 1 245 678
  • Lectures mappées : 1 198 432 (96,2%)
  • Couverture moyenne : 32,4x
  • Régions en dessous de 10x de couverture : 5 234 positions

Utilisation de "pysam". Filtrer les variants par qualité et profondeur

Résultat attendu:

  • 12 456 variants filtrés à 3 892 variants de haute qualité
  • Filtres appliqués : QUAL > 30, DP > 10, MQ > 40
  • Variants écrits dans filtered.vcf

Utilisation de "pysam". Extraire les séquences autour des positions de variants

Résultat attendu:

  • Séquences de 100pb extraites pour 847 variants
  • Séquences écrites dans variant_contexts.fasta
  • Région flanquante : +/- 50pb de chaque position de variant

Audit de sécurité

Sûr
v4 • 1/17/2026

All 447 static findings are FALSE POSITIVES caused by bioinformatics terminology being misinterpreted as security-relevant patterns. The scanner flags 'SAM' as Windows Security Account Manager when it means Sequence Alignment/Map format, and samtools/bcftools as network scanning tools when they are legitimate bioinformatics command-line utilities. The skill contains only documentation and code examples for legitimate genomic data processing. No actual malicious code, command injection, credential access, or network exfiltration patterns exist.

7
Fichiers analysés
2,265
Lignes analysées
2
résultats
4
Total des audits

Score de qualité

45
Architecture
90
Maintenabilité
85
Contenu
29
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Flux de travail d'analyse de variants

Extraire et filtrer les variants génétiques des fichiers VCF, annoter avec la couverture de lecture des fichiers BAM

Analyse de couverture

Calculer la couverture par base, identifier les régions à faible couverture, générer des pistes de couverture pour la visualisation

Pipeline de contrôle qualité

Valider les données de séquençage, vérifier la cohérence de la référence, filtrer les lectures par seuils de qualité

Essayez ces prompts

Lire les données d'alignement
Utiliser pysam pour ouvrir example.bam et afficher toutes les lectures chevauchant les positions chr1 1000-2000
Traiter les variants
Ouvrir variants.vcf et afficher tous les variants sur chr2 avec un score de qualité supérieur à 30
Calculer la couverture
Calculer la couverture par base pour les positions 100000-200000 du chromosome 1 en utilisant l'analyse pileup
Extraire les séquences
Ouvrir reference.fasta et extraire la séquence du gène ABC sur chr5 de la position 10000 à 11000

Bonnes pratiques

  • Toujours utiliser des fichiers BAM indexés pour les opérations d'accès aléatoire afin d'améliorer les performances
  • Se souvenir que pysam utilise des coordonnées 0-base tandis que les fichiers VCF utilisent des coordonnées 1-base
  • Utiliser pileup() pour l'analyse de couverture par colonne au lieu d'appels fetch() répétés

Éviter

  • Charger des fichiers BAM entiers en mémoire au lieu d'utiliser le traitement basé sur un itérateur
  • Ignorer les différences de système de coordonnées entre pysam et les formats de fichiers VCF
  • Traiter de grands fichiers sans créer de fichiers d'index pour l'accès aléatoire

Foire aux questions

Quelle est la différence entre les fichiers SAM et BAM ?
SAM est un format texte lisible par l'homme pour les données d'alignement. BAM est la version binaire compressée qui permet un accès aléatoire efficace et des fichiers plus petits.
Dois-je installer samtools séparément ?
Non, pysam inclut des liaisons aux commandes samtools et bcftools. La bibliothèque htslib sous-jacente est incluse avec pysam.
Comment créer un index pour mon fichier BAM ?
Utilisez pysam.index('votre_fichier.bam') pour créer le fichier d'index .bai. Cela permet des requêtes rapides par région.
pysam peut-il filtrer les lectures par qualité de mappage ?
Oui, utilisez le paramètre quality dans fetch() ou filtrez les lectures manuellement en utilisant l'attribut mapping_quality des objets AlignedSegment.
Quel système de coordonnées pysam utilise-t-il ?
Pysam utilise des coordonnées 0-base, demi-ouvertes pour l'accès programmatique. Cependant, les chaînes de région dans fetch() utilisent des coordonnées 1-base pour correspondre à la convention samtools.
Comment extraire les variants chevauchant un gène spécifique ?
Utilisez pysam.TabixFile pour ouvrir un fichier BED avec les coordonnées de gènes, puis utilisez vcf.fetch() avec ces coordonnées pour obtenir les variants chevauchants.