스킬 anndata
🔬

anndata

안전 ⚙️ 외부 명령어🌐 네트워크 접근

AnnData 매트릭스 작업

또한 다음에서 사용할 수 있습니다: davila7

AnnData는 단일세포 게노믹스에서 사용되는 주석이 포함된 매트릭스를 위한 표준화된 데이터 구조를 제공합니다. 이 스킬은 메타데이터, 임베딩, scverse 생태계를 완벽하게 지원하여 .h5ad 파일을 생성, 읽기, 쓰기 및 조작할 수 있게 합니다.

지원: Claude Codex Code(CC)
📊 71 적절함
1

스킬 ZIP 다운로드

2

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

3

토글을 켜고 사용 시작

테스트해 보기

"anndata" 사용 중입니다. How do I read a 10X Genomics H5 file and convert it to AnnData?

예상 결과:

  • ad.read_10x_h5()를 사용하여 H5 형식을 직접 읽습니다
  • 이 함수는 자동으로 유전자 및 바코드 추적을 처리합니다
  • 여러 참조가 있을 때 특정 참조를 선택하기 위한 선택적 genome 매개변수

"anndata" 사용 중입니다. What is backed mode and when should I use it?

예상 결과:

  • 백드 모드는 데이터를 디스크에 유지하고 액세스된 부분만 로드합니다
  • RAM보다 큰 데이터셋에서 메모리 부족 오류를 방지하기 위해 사용합니다
  • 메타데이터에 액세스하고 전체 파일을 메모리에 로드하지 않고 하위 집합을 생성합니다

보안 감사

안전
v4 • 1/17/2026

All 397 static findings are FALSE POSITIVES. This skill contains only markdown documentation with Python code examples. The static scanner incorrectly flags backticks in fenced code blocks, URLs in documentation links, and generic programming terms. No executable code, network operations, or credential handling exists. This is a legitimate scientific computing documentation skill for the AnnData Python library.

7
스캔된 파일
4,567
분석된 줄 수
2
발견 사항
4
총 감사 수
감사자: claude 감사 이력 보기 →

품질 점수

45
아키텍처
100
유지보수성
87
콘텐츠
21
커뮤니티
100
보안
91
사양 준수

만들 수 있는 것

단일세포 RNA-seq 분석

적절한 메타데이터 추적을 통해 단일세포 전사체학 연구를 위한 10X Genomics 데이터를 로드하고 처리합니다.

다중 배치 데이터 통합

자동 배치 레이블 추적 및 충돌 해결과 함께 여러 실험 배치를 결합합니다.

딥러닝 통합

단일세포 발현 데이터로 신경망을 훈련시키기 위해 PyTorch DataLoaders로 데이터를 내보냅니다.

이 프롬프트를 사용해 보세요

AnnData 객체 생성
numpy 배열에서 셀 유형 및 샘플 ID에 대한 관측값 메타데이터와 함께 AnnData 객체를 생성합니다.
H5AD 파일 읽기
백드 모드에서 H5AD 파일을 읽고 quality_score 열을 기반으로 고품질 셀을 필터링합니다.
배치 연결
배치 레이블과 내부 조인 함께 관측값 축을 따라 세 개의 AnnData 객체를 연결합니다.
메모리 최적화
문자열 열을 범주형으로 변환하고 메모리 효율성을 위해 희소 매트릭스를 사용하는 방법을 보여줍니다.

모범 사례

  • RAM보다 큰 데이터셋에 대해 백드 모드(backed='r')를 사용하여 메모리 부족 오류를 방지합니다.
  • strings_to_categoricals()를 사용하여 문자열 열을 범주형으로 변환하면 10-50배의 메모리를 절약합니다.
  • 필터링 전에 adata.raw = adata.copy()로 원시 데이터를 저장하여 필터링되지 않은 유전자에 대한 접근을 유지합니다.

피하기

  • 먼저 복사하지 않고 직접 뷰를 수정하지 마세요. 변경 사항이 원본 객체에 영향을 줄 수 있습니다.
  • 백드 모드가 지연 액세스를 제공할 수 있을 때 전체 대규모 데이터셋을 메모리에 로드하지 마세요.
  • set_index() 및 loc[].join()을 사용하여 외부 메타데이터를 추가할 때 인덱스 정렬 오류를 방지하세요.

자주 묻는 질문

백드 모드와 인메모리 모드의 차이점은 무엇인가요?
백드 모드는 데이터를 디스크에 유지하고 액세스된 부분만 로드하여 RAM보다 큰 데이터셋 작업을 가능하게 합니다.
RNA와 단백질과 같은 다양한 모달리티에 대해 여러 AnnData 객체를 어떻게 결합하나요?
RNA와 단백질과 같은 다양한 모달리티에 대해 여러 AnnData 객체를 결합하려면 Muon(MuData)을 사용하세요.
희소 매트릭스를 언제 사용해야 하나요?
데이터에 50% 이상의 0이 있을 때, 일반적인 단일세포 카운트 데이터에서 희소 매트릭스를 사용하세요.
각 셀이 어느 배치에서 왔는지 어떻게 추적하나요?
배치 열을 자동으로 추가하려면 ad.concat()에서 label 및 keys 매개변수를 사용하세요.
raw 속성은 무엇을 위한 것인가요?
raw는 필터링 전 데이터의 스냅샷을 저장하여 나중에 원본 필터링되지 않은 유전자에 접근할 수 있게 합니다.
메모리 부족 오류를 어떻게 처리하나요?
백드 모드를 사용하거나, 희소 매트릭스로 변환하거나, 문자열을 범주형으로 변환하거나, 청크로 처리하세요.

개발자 세부 정보

작성자

K-Dense-AI

라이선스

BSD-3-Clause license

참조

main