スキル zarr-python
📦

zarr-python

安全 ⚙️ 外部コマンド🌐 ネットワークアクセス

大規模なN次元配列を効率的に保存

こちらからも入手できます: davila7

メモリ制限を超える大規模なデータセットの操作。Zarr-pythonは、圧縮されたチャンク配列ストレージにより、効率的なクラウドネイティブの科学計算ワークフローを実現します。

対応: Claude Codex Code(CC)
⚠️ 67 貧弱
1

スキルZIPをダウンロード

2

Claudeでアップロード

設定 → 機能 → スキル → スキルをアップロードへ移動

3

オンにして利用開始

テストする

「zarr-python」を使用しています。 Create a Zarr array for storing temperature data with 365 time steps, 720 latitudes, and 1440 longitudes.

期待される結果:

  • Created Zarr array at 'temperature.zarr'
  • Shape: (365, 720, 1440) | Chunks: (1, 720, 1440) | Dtype: float32
  • Compression: Blosc (zstd, level 5) with shuffle filter
  • Each chunk contains one complete daily snapshot (~4MB)
  • Use z.append() to add new time steps efficiently

セキュリティ監査

安全
v4 • 1/17/2026

All 227 static findings are FALSE POSITIVES. The analyzer misidentified markdown documentation content as security vulnerabilities. Backticks in markdown are code formatting, not shell execution. Compression codec names (zstd, gzip, lz4) were flagged as cryptographic algorithms but are data compression. URLs are legitimate documentation links. No executable code, shell commands, or cryptographic operations exist in these documentation files.

4
スキャンされたファイル
2,641
解析された行数
2
検出結果
4
総監査数

リスク要因

⚙️ 外部コマンド (2)
🌐 ネットワークアクセス (1)
監査者: claude 監査履歴を表示 →

品質スコア

41
アーキテクチャ
100
保守性
81
コンテンツ
21
コミュニティ
100
セキュリティ
74
仕様準拠

作れるもの

気候モデルデータの保存

時間次元を持つテラバイト規模的气候データを保存。新しいタイムステップの効率的な追加を可能にします。

モデルチェックポイントの管理

大規模な埋め込み行列とモデル重みを保存。分散トレーニングのためにDaskと統合します。

ゲノムデータセットの処理

マルチテラバイト規模のゲノム配列を処理。コラボレーションのためにクラウドストレージを使用します。

これらのプロンプトを試す

基本的な配列セットアップ
Create a Zarr array with shape (10000, 10000), chunks of (1000, 1000), and float32 dtype. Store it at data/my_array.zarr.
クラウドストレージ
Set up a Zarr array stored in S3 with s3fs. Use bucket my-bucket and path data/arrays.zarr.
Dask連携
Load a Zarr array as a Dask array and compute the mean along axis 0 in parallel.
パフォーマンスチューニング
Create a Zarr array optimized for cloud storage: 10MB chunks, consolidated metadata, and sharding enabled.

ベストプラクティス

  • 最適なI/Oパフォーマンスのため、チャンクサイズは1-10MBを選択してください
  • チャンク形状をデータアクセスパターンに合わせて調整してください(例:時系列は時間優先)
  • クラウドストレージを使用する場合は、レイテンシを減らすためにメタデータを統合してください

回避

  • 大きな配列全体をメモリに読み込まないでください - チャンクごとに処理してください
  • 小さなチャンク(<1MB)は使用しないでください。余分なメタデータオーバーヘッドが発生します
  • 同期なしで同じクラウドストレージ場所に頻繁に書き込まないでください

よくある質問

Zarr v2とv3フォーマットの違いは何ですか?
V3はシャーディングをサポートし、メタデータが改善されています。V2は古いツールとの広範な互換性があります。Zarrは自動検出を行います。
適切なチャンクサイズはどのように選択すればよいですか?
チャンクあたり1-10MBを目標にしてください。float32データの場合、512x512要素は約1MBに相当します。
Zarrは利用可能なメモリより大きな配列を処理できますか?
はい。Zarrは現在の操作に必要なチャンクのみを読み込みます。Daskを使用して並列なアウトオブコア処理を行ってください。
どのような圧縮を使用すべきですか?
高速な圧縮にはBloscとlz4、バランスの取れた圧縮にはzstd、最大圧縮率にはgzipを使用してください。
ZarrはHDF5とどのように比較されますか?
Zarrはよりシンプルなクラウド統合、より良いメタデータ処理、そして並列アクセスパターンのネイティブサポートを提供します。
既存のHDF5ファイルでZarrを使用できますか?
はい。h5pyを使用してHDF5ファイルを読み込み、zarr.array()を使用してZarrフォーマットに変換します。

開発者の詳細

ファイル構成