스킬 scikit-bio
🧬

scikit-bio

안전 ⚙️ 외부 명령어🌐 네트워크 접근

scikit-bio로 생물학적 데이터 분석

또한 다음에서 사용할 수 있습니다: davila7

생물학적 시퀀스를 처리하고, 다양성 지표를 계산하며, 마이크로바이옴 및 생태 데이터에 대한 통계적 검정을 수행합니다. 이 스킬은 시퀀스 정렬, 계통 분석, 정렬 분석을 포함한 생물정보학 워크플로우에 대한 포괄적인 안내를 제공합니다.

지원: Claude Codex Code(CC)
📊 69 적절함
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"scikit-bio" 사용 중입니다. 내 OTU 테이블에서 다양성 지표 계산

예상 결과:

  • BIOM 테이블 읽기: Table.read('table.biom')
  • 알파 다양성 계산: alpha_diversity('shannon', counts, ids=sample_ids)
  • 베타 다양성 계산: beta_diversity('braycurtis', counts, ids=sample_ids)
  • PERMANOVA 실행: permanova(distance_matrix, grouping, permutations=999)

"scikit-bio" 사용 중입니다. 내 시퀀스에서 계통 발생 트리 구축

예상 결과:

  • FASTA에서 시퀀스 읽기: skbio.DNA.read('sequences.fasta')
  • 거리 행렬 계산: seq1.distance(seq2) 또는 kmer_distance 사용
  • NJ로 트리 구축: nj(distance_matrix)
  • Robinson-Foulds 거리 계산: tree.robinson_foulds(other_tree)

보안 감사

안전
v4 • 1/17/2026

Documentation-only skill with no executable code. All 133 static findings are false positives: detected backticks are markdown code delimiters, C2 keywords are scientific abbreviations (PC1, CCA, RDA for ordination methods), weak crypto flags are biological substitution matrices (BLOSUM62 for protein alignments), and URLs are official documentation links. No command injection, network exfiltration, or malicious patterns exist.

3
스캔된 파일
1,393
분석된 줄 수
2
발견 사항
4
총 감사 수
감사자: claude 감사 이력 보기 →

품질 점수

41
아키텍처
100
유지보수성
87
콘텐츠
20
커뮤니티
100
보안
83
사양 준수

만들 수 있는 것

마이크로바이옴 다양성 분석

OTU 테이블에서 알파 및 베타 다양성을 계산하고 표본 그룹화에 대한 PERMANOVA 검정 수행

계통 발생 트리 구축

시퀀스 정렬에서 트리를 구성하고 트리 비교를 위한 Robinson-Foulds 거리 계산

시퀀스 데이터 처리

유효성 검증을 통해 19개 이상의 파일 형식에서 생물학적 시퀀스 읽기, 필터링, 변환

이 프롬프트를 사용해 보세요

기본 시퀀스 작업
skbio로 FASTA 파일을 읽고, 역상보체를 계산하며, 정규표현식 패턴을 사용하여 모티프를 찾는 방법을 보여주세요.
다양성 분석
계수 행렬에서 Shannon 알파 다양성을 계산하고 표본 간 Bray-Curtis 베타 다양성을 계산하는 과정을 안내해 주세요.
계통 분석
거리 행렬에서 Neighbor Joining을 사용하여 계통 발생 트리를 구축하고 분류군 간의 계통 거리를 계산하는 것을 도와주세요.
통계적 검정
거리 행렬에서 PERMANOVA 검정을 실행하여 표본 그룹이 유의하게 다른지 999번 순열로 확인하는 방법을 보여주세요.

모범 사례

  • 큰 시퀀스 파일의 경우 제너레이터(skbio.io.read)를 사용하여 메모리 문제 방지
  • 다운스트림 분석 및 시각화를 위해 pandas와 numpy 통합
  • 다양성 계산 전에 파일 간 시퀀스 ID 일치 여부 검증

피하기

  • 상대 빈도를 계수에 사용하지 않기 - 먼저 정수로 변환
  • Robinson-Foulds 거리 계산 시 뿌리 있는 트리와 뿌리 없는 트리를 혼합하지 않기
  • PERMANOVA 실행 시 PERMDISP 건너뛰지 않기 - 분산 가정 확인

자주 묻는 질문

scikit-bio는 어떤 파일 형식을 지원합니까?
FASTA, FASTQ, GenBank, EMBL, Clustal, PHYLIP, Stockholm, Newick, BIOM(HDF5/JSON) 및 구분된 행렬을 지원합니다.
계통 발생 다양성은 어떻게 계산합니까?
뿌리 있는 계통 발생 트리를 사용하여 alpha_diversity('faith_pd', counts, tree=tree, otu_ids=feature_ids)로 계산할 수 있습니다.
알파와 베타 다양성의 차이점은 무엇입니까?
알파 다양성은 표본 내 다양성(예: Shannon, Simpson)을, 베타 다양성은 표본 간 상이성(예: Bray-Curtis, UniFrac)을 측정합니다.
scikit-bio를 QIIME 2와 함께 사용할 수 있습니까?
네, scikit-bio는 BIOM 테이블, 트리 및 거리 행렬을 포함하여 QIIME 2 호환 형식을 읽고 쓸 수 있습니다.
큰 시퀀스 파일을 효율적으로 처리하려면 어떻게 해야 합니까?
제너레이터 기반 읽기 사용: for seq in skbio.io.read('large.fasta', format='fasta', constructor=skbio.DNA)
생태 데이터에 대해 어떤 통계적 검정을 사용할 수 있습니까?
PERMANOVA, ANOSIM, PERMDISP, Mantel 검정 및 환경 변수 선택을 위한 Bioenv을 지원합니다.

개발자 세부 정보

작성자

K-Dense-AI

라이선스

BSD-3-Clause license

참조

main

파일 구조