스킬 zarr-python

📦

zarr-python

Name: zarr-python
Author: K-Dense-AI

안전 ⚙️ 외부 명령어🌐 네트워크 접근

대규모 N차원 배열을 효율적으로 저장

또한 다음에서 사용할 수 있습니다: davila7

메모리 한계를 초과하는 대규모 데이터셋 작업. Zarr-python은 압축을 사용한 청크 배열 저장을 지원하여 효율적인 클라우드 네이티브 과학 컴퓨팅 워크플로우를 가능하게 합니다.

지원: Claude Codex Code(CC)

⚠️ 67 나쁨

스킬 ZIP 다운로드

Claude에서 업로드

설정 → 기능 → 스킬 → 스킬 업로드로 이동

토글을 켜고 사용 시작

테스트해 보기

"zarr-python" 사용 중입니다. 365개의 시간 스텝, 720개의 위도, 1440개의 경도를 가진 기온 데이터를 저장하기 위한 Zarr 배열 생성.

예상 결과:

Created Zarr array at 'temperature.zarr'
Shape: (365, 720, 1440) | Chunks: (1, 720, 1440) | Dtype: float32
Compression: Blosc (zstd, level 5) with shuffle filter
Each chunk contains one complete daily snapshot (~4MB)
Use z.append() to add new time steps efficiently

보안 감사

안전

v4 • 1/17/2026

All 227 static findings are FALSE POSITIVES. The analyzer misidentified markdown documentation content as security vulnerabilities. Backticks in markdown are code formatting, not shell execution. Compression codec names (zstd, gzip, lz4) were flagged as cryptographic algorithms but are data compression. URLs are legitimate documentation links. No executable code, shell commands, or cryptographic operations exist in these documentation files.

스캔된 파일

2,641

분석된 줄 수

발견 사항

총 감사 수

위험 요인

⚙️ 외부 명령어 (2)

references/api_reference.md:7-515 SKILL.md:19-762

🌐 네트워크 접근 (1)

SKILL.md:768-776

감사자: claude 감사 이력 보기 →

품질 점수

아키텍처

100

유지보수성

콘텐츠

커뮤니티

100

보안

사양 준수

만들 수 있는 것

기후 모델 데이터 저장

시간 차원을 가진 테라바이트 규모 기후 데이터 저장. 새 타임스텝을 효율적으로 추가 가능.

모델 체크포인트 관리

대규모 임베딩 매트릭스와 모델 가중치 저장. 분산 학습을 위한 Dask 통합.

유전체 데이터셋 처리

멀티 테라바이트 유전체 배열 처리. 협업을 위한 클라우드 저장소 사용.

이 프롬프트를 사용해 보세요

기본 배열 설정

Create a Zarr array with shape (10000, 10000), chunks of (1000, 1000), and float32 dtype. Store it at data/my_array.zarr.

클라우드 저장소

Set up a Zarr array stored in S3 with s3fs. Use bucket my-bucket and path data/arrays.zarr.

Dask 통합

Load a Zarr array as a Dask array and compute the mean along axis 0 in parallel.

성능 튜닝

Create a Zarr array optimized for cloud storage: 10MB chunks, consolidated metadata, and sharding enabled.

모범 사례

최적의 I/O 성능을 위해 1-10MB 크기의 청크 선택
데이터 접근 패턴에 맞게 청크 모양 정렬 (예: 시계열은 시간 우선)
클라우드 저장소 사용 시 지연시간 줄이기 위해 메타데이터 통합

피하기

전체 큰 배열을 메모리에 로드하는 것 피하기 - 청크로 처리
작은 청크(<1MB) 사용하지 않기 - 과도한 메타데이터 오버헤드 발생
동기화 없이 동일한 클라우드 저장소 위치에 빈번한 쓰기 피하기

자주 묻는 질문

Zarr v2와 v3 포맷의 차이점은?

V3은 셰이딩과 개선된 메타데이터 지원. V2는 이전 도구와 넓은 호환성. Zarr가 포맷을 자동 감지.

올바른 청크 크기는 어떻게 선택?

청크당 1-10MB 목표. float32 데이터의 경우 512x512 요소가 약 1MB.

Zarr가 사용 가능한 메모리보다 큰 배열을 처리 가능?

네. Zarr는 현재 작업에 필요한 청크만 로드합니다. 병렬 코어 외 처리를 위해 Dask 사용.

어떤 압축을 사용해야?

속도를 위해 Blosc와 lz4 사용, 균형 잡힌 압축을 위해 zstd, 최대 압축률을 위해 gzip 사용.

Zarr는 HDF5와 비교해 어떻게 다름?

Zarr는 더 단순한 클라우드 통합, 더 나은 메타데이터 처리, 병렬 접근 패턴의 네이티브 지원을 제공.

기존 HDF5 파일과 Zarr을 함께 사용 가능?

네. h5py로 HDF5 파일을 읽고 zarr.array()로 Zarr 포맷으로 변환.

개발자 세부 정보

작성자

K-Dense-AI

라이선스

MIT license

리포지토리

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/zarr-python

참조

main

파일 구조

📁 references/

📄 api_reference.md

📄 EVALUATION_OUTPUT.json

📄 SKILL.md