pysam
Arbeiten mit genomischen Sequenzierungsdateien
Auch verfügbar von: davila7
Verarbeiten und analysieren Sie DNA-Sequenzierungsdaten mit Werkzeugen zum Lesen von BAM-, VCF- und FASTQ-Dateien. Extrahieren Sie genomische Regionen, berechnen Sie Abdeckungsstatistiken und integrieren Sie mehrere Dateitypen für eine umfassende Variantenanalyse.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "pysam". Öffnen Sie eine BAM-Datei und zeigen Sie Abdeckungsstatistiken für Chromosom 1
Erwartetes Ergebnis:
- Chromosom 1 Statistiken:
- Gesamtzahl der Lesungen: 1.245.678
- Zugeordnete Lesungen: 1.198.432 (96,2%)
- Mittlere Abdeckung: 32,4x
- Regionen unter 10x Abdeckung: 5.234 Positionen
Verwendung von "pysam". Filtern Sie Varianten nach Qualität und Tiefe
Erwartetes Ergebnis:
- Gefiltert 12.456 Varianten auf 3.892 hochwertige Varianten
- Angewendete Filter: QUAL > 30, DP > 10, MQ > 40
- Varianten geschrieben nach filtered.vcf
Verwendung von "pysam". Extrahieren Sie Sequenzen um Variantenpositionen
Erwartetes Ergebnis:
- Extrahierte 100bp-Sequenzen für 847 Varianten
- Sequenzen geschrieben nach variant_contexts.fasta
- Flankierende Region: +/- 50bp von jeder Variantenposition
Sicherheitsaudit
SicherAll 447 static findings are FALSE POSITIVES caused by bioinformatics terminology being misinterpreted as security-relevant patterns. The scanner flags 'SAM' as Windows Security Account Manager when it means Sequence Alignment/Map format, and samtools/bcftools as network scanning tools when they are legitimate bioinformatics command-line utilities. The skill contains only documentation and code examples for legitimate genomic data processing. No actual malicious code, command injection, credential access, or network exfiltration patterns exist.
Risikofaktoren
⚙️ Externe Befehle (3)
📁 Dateisystemzugriff (2)
Qualitätsbewertung
Was du bauen kannst
Variantenanalyse-Workflow
Extrahieren und Filtern genetischer Varianten aus VCF-Dateien, Annotieren mit Lesetiefe aus BAM-Dateien
Abdeckungsanalyse
Berechnen der Basen-abhängigen Abdeckung, Identifizieren von Regionen mit geringer Abdeckung, Generieren von Abdeckungsspuren für die Visualisierung
Qualitätskontroll-Pipeline
Validieren von Sequenzierungsdaten, Überprüfen der Referenzkonsistenz, Filtern von Lesungen nach Qualitätsschwellenwerten
Probiere diese Prompts
Verwenden Sie pysam, um example.bam zu öffnen und alle Lesungen zu drucken, die chr1-Positionen 1000-2000 überlappen
Öffnen Sie variants.vcf und drucken Sie alle Varianten auf chr2 mit einem Qualitätswert über 30
Berechnen Sie die Basen-abhängige Abdeckung für Chromosom 1 Positionen 100000-200000 mit Pileup-Analyse
Öffnen Sie reference.fasta und extrahieren Sie die Sequenz für Gen ABC auf chr5 von Position 10000 bis 11000
Bewährte Verfahren
- Verwenden Sie immer indizierte BAM-Dateien für Zufallszugriffsoperationen zur Leistungsverbesserung
- Denken Sie daran, dass pysam 0-basierte Koordinaten verwendet, während VCF-Dateien 1-basierte Koordinaten verwenden
- Verwenden Sie pileup() für spaltenweise Abdeckungsanalysen anstelle wiederholter fetch()-Aufrufe
Vermeiden
- Laden ganzer BAM-Dateien in den Speicher anstelle von iteratorbasierter Verarbeitung
- Ignorieren der Koordinatensystemunterschiede zwischen pysam- und VCF-Dateiformaten
- Verarbeiten großer Dateien ohne Erstellen von Indexdateien für Zufallszugriff