📦

zarr-python

Name: zarr-python
Author: K-Dense-AI

Sicher ⚙️ Externe Befehle🌐 Netzwerkzugriff

Große N-dimensionale Arrays effizient speichern

Auch verfügbar von: davila7

Arbeit mit großen Datensätzen, die die Speicherlimits überschreiten. Zarr-python ermöglicht Chunk-basierte Arrayspeicherung mit Komprimierung für effiziente Cloud-native wissenschaftliche Berechnungs-Workflows.

Unterstützt: Claude Codex Code(CC)

⚠️ 67 Schlecht

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "zarr-python". Create a Zarr array for storing temperature data with 365 time steps, 720 latitudes, and 1440 longitudes.

Erwartetes Ergebnis:

Created Zarr array at 'temperature.zarr'
Shape: (365, 720, 1440) | Chunks: (1, 720, 1440) | Dtype: float32
Compression: Blosc (zstd, level 5) with shuffle filter
Each chunk contains one complete daily snapshot (~4MB)
Use z.append() to add new time steps efficiently

Sicherheitsaudit

Sicher

v4 • 1/17/2026

All 227 static findings are FALSE POSITIVES. The analyzer misidentified markdown documentation content as security vulnerabilities. Backticks in markdown are code formatting, not shell execution. Compression codec names (zstd, gzip, lz4) were flagged as cryptographic algorithms but are data compression. URLs are legitimate documentation links. No executable code, shell commands, or cryptographic operations exist in these documentation files.

Gescannte Dateien

2,641

Analysierte Zeilen

befunde

Gesamtzahl Audits

Risikofaktoren

⚙️ Externe Befehle (2)

references/api_reference.md:7-515 SKILL.md:19-762

🌐 Netzwerkzugriff (1)

SKILL.md:768-776

Auditiert von: claude Audit-Verlauf anzeigen →

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Klimamodelldaten speichern

Terabyte-große Klimadaten mit Zeitdimensionen speichern. Effizientes Hinzufügen neuer Zeitschritte ermöglichen.

Modell-Checkpoints verwalten

Große Einbettungsmatrizen und Modellgewichte speichern. Integration mit Dask für verteiltes Training.

Genomische Datensätze verarbeiten

Multi-Terabyte-genomische Arrays handhaben. Cloud-Speicher für Zusammenarbeit nutzen.

Probiere diese Prompts

Grundlegendes Array-Setup

Create a Zarr array with shape (10000, 10000), chunks of (1000, 1000), and float32 dtype. Store it at data/my_array.zarr.

Cloud-Speicher

Set up a Zarr array stored in S3 with s3fs. Use bucket my-bucket and path data/arrays.zarr.

Dask-Integration

Load a Zarr array as a Dask array and compute the mean along axis 0 in parallel.

Leistungsoptimierung

Create a Zarr array optimized for cloud storage: 10MB chunks, consolidated metadata, and sharding enabled.

Bewährte Verfahren

Wählen Sie Chunk-Größen von 1-10 MB für optimale I/O-Leistung
Richten Sie die Chunk-Form nach Ihrem Datenzugriffsmuster aus (z.B. Zeit-zuerst für Zeitreihen)
Konsolidieren Sie Metadaten bei Verwendung von Cloud-Speicher um Latenz zu reduzieren

Vermeiden

Vermeiden Sie das Laden gesamter großer Arrays in den Speicher - verarbeiten Sie in Chunks
Verwenden Sie keine kleinen Chunks (<1MB) da sie übermäßigen Metadaten-Overhead erzeugen
Vermeiden Sie häufige Schreibvorgänge am selben Cloud-Speicherort ohne Synchronisation

Häufig gestellte Fragen

Was ist der Unterschied zwischen Zarr v2 und v3 Formaten?

V3 unterstützt Sharding und hat verbesserte Metadaten. V2 ist weitgehend kompatibel mit älteren Tools. Zarr erkennt das Format automatisch.

Wie wähle ich die richtige Chunk-Größe?

Zielen Sie auf 1-10 MB pro Chunk. Für float32-Daten entsprechen 512x512 Elemente ungefähr 1 MB.

Kann Zarr Arrays verarbeiten, die größer als der verfügbare Speicher sind?

Ja. Zarr lädt nur Chunks, die für aktuelle Operationen benötigt werden. Verwenden Sie Dask für parallele Out-of-Core-Verarbeitung.

Welche Komprimierung sollte ich verwenden?

Verwenden Sie Blosc mit lz4 für Geschwindigkeit, zstd für ausgewogene Komprimierung oder gzip für maximales Komprimierungsverhältnis.

Wie vergleicht sich Zarr mit HDF5?

Zarr bietet einfachere Cloud-Integration, bessere Metadatenbehandlung und native Unterstützung für parallele Zugriffsmuster.

Kann ich Zarr mit bestehenden HDF5-Dateien verwenden?

Ja. Verwenden Sie h5py um HDF5-Dateien zu lesen und zarr.array() um sie in das Zarr-Format zu konvertieren.

Entwicklerdetails

Autor

K-Dense-AI

Lizenz

MIT license

Repository

https://github.com/K-Dense-AI/claude-scientific-skills/tree/main/scientific-skills/zarr-python

Ref

main

Dateistruktur

📁 references/

📄 api_reference.md

📄 EVALUATION_OUTPUT.json

📄 SKILL.md