스킬 pysam
🧬

pysam

안전 ⚙️ 외부 명령어📁 파일 시스템 액세스

유전체 시퀀싱 파일 작업

또한 다음에서 사용할 수 있습니다: davila7

BAM, VCF, FASTQ 파일을 읽는 도구로 DNA 시퀀싱 데이터를 처리하고 분석합니다. 유전체 영역을 추출하고, 커버리지 통계를 계산하며, 다양한 파일 유형을 통합하여 포괄적인 변이 분석을 수행합니다.

지원: Claude Codex Code(CC)
📊 71 적절함
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"pysam" 사용 중입니다. BAM 파일을 열고 크로모존 1에 대한 커버리지 통계 표시

예상 결과:

  • 크로모존 1 통계:
  • 총 읽기 수: 1,245,678
  • 매핑된 읽기: 1,198,432 (96.2%)
  • 평균 커버리지: 32.4x
  • 10x 미만 커버리지 영역: 5,234 위치

"pysam" 사용 중입니다. 품질 및 깊이로 변이 필터링

예상 결과:

  • 12,456개 변이를 3,892개의 고품질 변이로 필터링
  • 적용된 필터: QUAL > 30, DP > 10, MQ > 40
  • 변이가 filtered.vcf에 기록됨

"pysam" 사용 중입니다. 변이 위치 주변 시퀀스 추출

예상 결과:

  • 847개 변이에 대한 100bp 시퀀스 추출
  • 시퀀스가 variant_contexts.fasta에 기록됨
  • 인접 영역: 각 변이 위치에서 +/- 50bp

보안 감사

안전
v4 • 1/17/2026

All 447 static findings are FALSE POSITIVES caused by bioinformatics terminology being misinterpreted as security-relevant patterns. The scanner flags 'SAM' as Windows Security Account Manager when it means Sequence Alignment/Map format, and samtools/bcftools as network scanning tools when they are legitimate bioinformatics command-line utilities. The skill contains only documentation and code examples for legitimate genomic data processing. No actual malicious code, command injection, credential access, or network exfiltration patterns exist.

7
스캔된 파일
2,265
분석된 줄 수
2
발견 사항
4
총 감사 수
감사자: claude 감사 이력 보기 →

품질 점수

45
아키텍처
90
유지보수성
85
콘텐츠
29
커뮤니티
100
보안
91
사양 준수

만들 수 있는 것

변이 분석 워크플로우

VCF 파일에서 유전 변이를 추출 및 필터링하고, BAM 파일에서 읽기 커버리지로 주석 추가

커버리지 분석

베이스별 커버리지 계산, 낮은 커버리지 영역 식별, 시각화를 위한 커버리지 트랙 생성

품질 관리 파이프라인

시퀀싱 데이터 검증, 참조 일관성 확인, 품질 임계값별 읽기 필터링

이 프롬프트를 사용해 보세요

정렬 데이터 읽기
pysam을 사용하여 example.bam을 열고 chr1 위치 1000-2000에서 중첩된 모든 읽기 출력
변이 처리
variants.vcf를 열고 품질 점수가 30보다 높은 chr2의 모든 변이 출력
커버리지 계산
파일 분석을 사용하여 크로모존 1 위치 100000-200000에 대한 베이스별 커버리지 계산
시퀀스 추출
reference.fasta를 열고 chr5에서 gene ABC의 위치 10000에서 11000까지의 시퀀스 추출

모범 사례

  • 임의 접근 작업에서 성능 향상을 위해 항상 인덱싱된 BAM 파일 사용
  • pysam은 0 기반 좌표를 사용하는 반면 VCF 파일은 1 기반 좌표를 사용함을 기억
  • 반복적인 fetch() 호출 대신 file_analysis()를 사용하여 열별 커버리지 분석 수행

피하기

  • 반복자 기반 처리 대신 전체 BAM 파일을 메모리로 로드
  • pysam과 VCF 파일 형식 간의 좌표계 차이 무시
  • 임의 접근을 위해 인덱스 파일 생성 없이 큰 파일 처리

자주 묻는 질문

SAM과 BAM 파일의 차이점은 무엇입니까?
SAM은 정렬 데이터에 대한 사람이 읽을 수 있는 텍스트 형식입니다. BAM은 효율적인 임의 접근과 더 작은 파일 크기를 가능하게 하는 압축된 이진 버전입니다.
samtools를 별도로 설치해야 합니까?
아니요, pysam에는 samtools 및 bcftools 명령에 대한 바인딩이 포함되어 있습니다. 기본 htslib 라이브러리는 pysam과 함께 포함됩니다.
BAM 파일에 대한 인덱스를 어떻게 만듭니까?
pysam.index('your_file.bam')를 사용하여 .bai 인덱스 파일을 생성합니다. 이를 통해 빠른 지역 기반 쿼리가 가능합니다.
pysam이 매핑 품질로 읽기를 필터링할 수 있습니까?
예, fetch()의 품질 매개변수를 사용하거나 AlignedSegment 개체의 mapping_quality 속성을 사용하여 수동으로 읽기를 필터링할 수 있습니다.
pysam은 어떤 좌표 시스템을 사용합니까?
pysam은 프로그래밍 방식 접근을 위해 0 기반, 반개방 좌표를 사용합니다. 그러나 fetch()의 지역 문자열은 samtools 규칙과 일치하도록 1 기반 좌표를 사용합니다.
특정 유전자와 중첩된 변이를 어떻게 추출합니까?
pysam.TabixFile을 사용하여 유전체 좌표가 있는 BEF 파일을 열고, 해당 좌표로 vcf.fetch()를 사용하여 중첩된 변이를 가져옵니다.

개발자 세부 정보