🧬

pysam

Name: pysam
Author: K-Dense-AI

Sicher ⚙️ Externe Befehle📁 Dateisystemzugriff

Arbeiten mit genomischen Sequenzierungsdateien

Auch verfügbar von: davila7

Verarbeiten und analysieren Sie DNA-Sequenzierungsdaten mit Werkzeugen zum Lesen von BAM-, VCF- und FASTQ-Dateien. Extrahieren Sie genomische Regionen, berechnen Sie Abdeckungsstatistiken und integrieren Sie mehrere Dateitypen für eine umfassende Variantenanalyse.

Unterstützt: Claude Codex Code(CC)

📊 70 Angemessen

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "pysam". Öffnen Sie eine BAM-Datei und zeigen Sie Abdeckungsstatistiken für Chromosom 1

Erwartetes Ergebnis:

Chromosom 1 Statistiken:
Gesamtzahl der Lesungen: 1.245.678
Zugeordnete Lesungen: 1.198.432 (96,2%)
Mittlere Abdeckung: 32,4x
Regionen unter 10x Abdeckung: 5.234 Positionen

Verwendung von "pysam". Filtern Sie Varianten nach Qualität und Tiefe

Erwartetes Ergebnis:

Gefiltert 12.456 Varianten auf 3.892 hochwertige Varianten
Angewendete Filter: QUAL > 30, DP > 10, MQ > 40
Varianten geschrieben nach filtered.vcf

Verwendung von "pysam". Extrahieren Sie Sequenzen um Variantenpositionen

Erwartetes Ergebnis:

Extrahierte 100bp-Sequenzen für 847 Varianten
Sequenzen geschrieben nach variant_contexts.fasta
Flankierende Region: +/- 50bp von jeder Variantenposition

Sicherheitsaudit

Sicher

v4 • 1/17/2026

All 447 static findings are FALSE POSITIVES caused by bioinformatics terminology being misinterpreted as security-relevant patterns. The scanner flags 'SAM' as Windows Security Account Manager when it means Sequence Alignment/Map format, and samtools/bcftools as network scanning tools when they are legitimate bioinformatics command-line utilities. The skill contains only documentation and code examples for legitimate genomic data processing. No actual malicious code, command injection, credential access, or network exfiltration patterns exist.

Gescannte Dateien

2,265

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (3)

SKILL.md:30-237 references/alignment_files.md:1-300 references/common_workflows.md:1-500

📁 Dateisystemzugriff (2)

references/common_workflows.md:311 references/sequence_files.md:205

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Variantenanalyse-Workflow

Extrahieren und Filtern genetischer Varianten aus VCF-Dateien, Annotieren mit Lesetiefe aus BAM-Dateien

Abdeckungsanalyse

Berechnen der Basen-abhängigen Abdeckung, Identifizieren von Regionen mit geringer Abdeckung, Generieren von Abdeckungsspuren für die Visualisierung

Qualitätskontroll-Pipeline

Validieren von Sequenzierungsdaten, Überprüfen der Referenzkonsistenz, Filtern von Lesungen nach Qualitätsschwellenwerten

Probiere diese Prompts

Alignment-Daten lesen

Verwenden Sie pysam, um example.bam zu öffnen und alle Lesungen zu drucken, die chr1-Positionen 1000-2000 überlappen

Varianten verarbeiten

Öffnen Sie variants.vcf und drucken Sie alle Varianten auf chr2 mit einem Qualitätswert über 30

Abdeckung berechnen

Berechnen Sie die Basen-abhängige Abdeckung für Chromosom 1 Positionen 100000-200000 mit Pileup-Analyse

Sequenzen extrahieren

Öffnen Sie reference.fasta und extrahieren Sie die Sequenz für Gen ABC auf chr5 von Position 10000 bis 11000

Bewährte Verfahren

Verwenden Sie immer indizierte BAM-Dateien für Zufallszugriffsoperationen zur Leistungsverbesserung
Denken Sie daran, dass pysam 0-basierte Koordinaten verwendet, während VCF-Dateien 1-basierte Koordinaten verwenden
Verwenden Sie pileup() für spaltenweise Abdeckungsanalysen anstelle wiederholter fetch()-Aufrufe

Vermeiden

Laden ganzer BAM-Dateien in den Speicher anstelle von iteratorbasierter Verarbeitung
Ignorieren der Koordinatensystemunterschiede zwischen pysam- und VCF-Dateiformaten
Verarbeiten großer Dateien ohne Erstellen von Indexdateien für Zufallszugriff

Häufig gestellte Fragen

Was ist der Unterschied zwischen SAM- und BAM-Dateien?

SAM ist ein menschenlesbares Textformat für Alignment-Daten. BAM ist die komprimierte binäre Version, die effizienten Zufallszugriff und kleinere Dateigrößen ermöglicht.

Muss ich samtools separat installieren?

Nein, pysam enthält Bindungen zu samtools- und bcftools-Befehlen. Die zugrunde liegende htslib-Bibliothek ist in pysam enthalten.

Wie erstelle ich einen Index für meine BAM-Datei?

Verwenden Sie pysam.index('your_file.bam'), um die .bai-Indexdatei zu erstellen. Dies ermöglicht schnelle regionsbasierte Abfragen.

Kann pysam Lesungen nach Mapping-Qualität filtern?

Ja, verwenden Sie den quality-Parameter in fetch() oder filtern Sie Lesungen manuell mit dem mapping_quality-Attribut von AlignedSegment-Objekten.

Welches Koordinatensystem verwendet pysam?

Pysam verwendet 0-basierte, halboffene Koordinaten für programmatischen Zugriff. Regionsstrings in fetch() verwenden jedoch 1-basierte Koordinaten, um die samtools-Konvention zu erfüllen.

Wie extrahiere ich Varianten, die ein bestimmtes Gen überlappen?

Verwenden Sie pysam.TabixFile, um eine BED-Datei mit Genkoordinaten zu öffnen, und verwenden Sie dann vcf.fetch() mit diesen Koordinaten, um überlappende Varianten zu erhalten.

Entwicklerdetails

Autor

K-Dense-AI

Lizenz

MIT license

Repository

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/pysam

Ref

main

Dateistruktur

📁 references/

📄 alignment_files.md

📄 common_workflows.md

📄 sequence_files.md

📄 variant_files.md

📄 EVALUATION_OUTPUT.json

📄 SKILL.md