Fähigkeiten Azure Data Lake Storage Gen2 SDK for Python
📦

Azure Data Lake Storage Gen2 SDK for Python

Sicher

Mit Azure Data Lake Storage in Python arbeiten

Diese Fähigkeit ermöglicht es Claude, mit Azure Data Lake Storage Gen2 über das Python SDK zu interagieren und bietet Dateioperationen, Verzeichnisverwaltung und Zugriffskontrollfunktionen für Cloud-Daten-Workflows.

Unterstützt: Claude Codex Code(CC)
🥉 72 Bronze
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "Azure Data Lake Storage Gen2 SDK for Python". How do I create a new file system in Azure Data Lake Gen2?

Erwartetes Ergebnis:

  • So erstellen Sie ein Dateisystem (Container) in Azure Data Lake Gen2:
  •  
  • 1. Verwenden Sie den DataLakeServiceClient, um sich mit Ihrem Speicherkonto zu verbinden
  • 2. Rufen Sie die Methode create_file_system() auf
  •  
  • Beispielcode:
  • ```python
  • from azure.storage.filedatalake import DataLakeServiceClient
  •  
  • def create_datalake_filesystem(storage_account_name, sas_token):
  • service_client = DataLakeServiceClient(
  • account_url=f"https://{storage_account_name}.dfs.core.windows.net",
  • credential=sas_token
  • )
  • filesystem_client = service_client.create_file_system('my-container')
  • return filesystem_client
  • ```

Verwendung von "Azure Data Lake Storage Gen2 SDK for Python". What are best practices for organizing data in Data Lake?

Erwartetes Ergebnis:

  • Best Practices für Azure Data Lake-Organisation:
  •  
  • 1. **Hierarchischen Namespace verwenden** - Bei der Erstellung für HDFS-kompatible Pfade aktivieren
  • 2. **Namenskonventionen befolgen** - Kleinbuchstaben, Bindestriche, konsistente Datumsformate verwenden
  • 3. **Gestaffelten Speicher implementieren** - Lebenszyklusrichtlinien für heiße/warme/kalte Ebenen verwenden
  • 4. **ACLs korrekt einrichten** - Minimal erforderliche Berechtigungen erteilen
  • 5. **Klug partitionieren** - Nach häufig abgefragten Feldern wie Datum/Region organisieren

Verwendung von "Azure Data Lake Storage Gen2 SDK for Python". How do I configure access permissions for a directory?

Erwartetes Ergebnis:

  • So konfigurieren Sie ACLs auf Azure Data Lake Gen2:
  •  
  • 1. Erhalten Sie den Verzeichnis-Client mit get_directory_client()
  • 2. Verwenden Sie set_access_control(), um POSIX-Berechtigungen festzulegen
  • 3. Oder verwenden Sie update_access_control_recursive() für Stapelaktualisierungen
  •  
  • Berechtigungen folgen dem POSIX-Format: owner:group:permissions
  • Beispiel: 'user::rwx,group::r-x,other::r--'

Sicherheitsaudit

Sicher
v1 • 2/25/2026

Static analysis scanned 0 files (0 lines) and detected 0 potential security issues. This is a prompt-only skill with no executable code. The skill provides descriptions and context for Azure Data Lake Storage Gen2 SDK usage without executing any operations. Risk score: 0/100.

0
Gescannte Dateien
0
Analysierte Zeilen
0
befunde
1
Gesamtzahl Audits
Keine Sicherheitsprobleme gefunden
Auditiert von: claude

Qualitätsbewertung

38
Architektur
100
Wartbarkeit
87
Inhalt
50
Community
100
Sicherheit
74
Spezifikationskonformität

Was du bauen kannst

Cloud-Daten-Ingenieur, der Daten-Pipelines verwaltet

Python-Code generieren, um Daten zwischen lokalen Systemen und Azure Data Lake für ETL-Pipelines zu verschieben

Entwickler, der serverlose Anwendungen erstellt

Azure Data Lake Storage für serverlose Apps mit entsprechenden Zugriffskontrollen erstellen und konfigurieren

Data Scientist, der Datensätze organisiert

Machine Learning-Datensätze in Azure Data Lake mit geeigneter Hierarchie strukturieren und organisieren

Probiere diese Prompts

Dateien in einem Verzeichnis auflisten
Zeigen Sie mir, wie ich alle Dateien in einem Azure Data Lake Gen2-Verzeichnis mit dem Python SDK auflisten kann
Datei mit Zugriffskontrolle hochladen
Python-Code generieren, um eine Datei mit spezifischen ACL-Berechtigungen in Azure Data Lake Storage hochzuladen
Hierarchische Verzeichnisstruktur erstellen
Helfen Sie mir, eine verschachtelte Verzeichnisstruktur in Azure Data Lake Gen2 zu erstellen, um Daten nach Datum und Kategorie zu organisieren
Datamigrationsskript implementieren
Erstellen Sie ein Python-Skript, um einen großen Ordner von lokalem Speicher nach Azure Data Lake Gen2 mit entsprechender Fehlerbehandlung und Logging zu migrieren

Bewährte Verfahren

  • Aktivieren Sie immer den hierarchischen Namespace bei der Erstellung neuer Data-Lake-Konten für HDFS-Kompatibilität
  • Verwenden Sie verwaltete Identitäten oder Key Vault für die Anmeldedatenverwaltung anstatt Geheimnisse fest zu codieren
  • Implementieren Sie entsprechende Fehlerbehandlung und Wiederholungslogik für Produktions-Datenoperationen

Vermeiden

  • Azure-Speicherkontoschlüssel nicht in Quellcode fest codieren - Umgebungsvariablen oder Azure Key Vault verwenden
  • Keine zu breiten Berechtigungen erteilen - Prinzip der geringsten Privilegien für ACLs befolgen
  • Sensible Daten nicht ohne Aktivierung der Verschlegung im Ruhezustand und mit entsprechenden Zugriffskontrollen hochladen

Häufig gestellte Fragen

Was ist Azure Data Lake Storage Gen2?
Azure Data Lake Storage Gen2 ist ein Cloud-Speicherdienst, der auf Azure Blob Storage aufbaut und Dateisystem-Semantik, Sicherheit und Skalierbarkeit für Big-Data-Analytics-Workloads bietet. Er vereint die Funktionen von Azure Blob Storage mit Data-Lake-Features, einschließlich hierarchischem Namespace und POSIX-kompatibler Zugriffskontrolle.
Wie unterscheidet sich diese Fähigkeit von Azure Blob Storage?
Während Blob Storage ein universeller Objektspeicher ist, fügt Data Lake Gen2 Unterstützung für hierarchische Namespace für HDFS-kompatible Verzeichnisstrukturen, POSIX-basierte ACLs und optimierte Leistung für Analytics-Workloads hinzu. Verwenden Sie Data Lake Gen2 für Big-Data-Analytics; verwenden Sie Blob Storage für allgemeine Objektspeicher-Anforderungen.
Benötige ich ein Azure-Abonnement, um diese Fähigkeit zu nutzen?
Diese Fähigkeit generiert Python-Code und bietet Anleitung für Azure Data Lake-Operationen. Um den Code auszuführen, benötigen Sie ein gültiges Azure-Abonnement mit einem Data Lake Storage Gen2-Konto. Die Fähigkeit selbst erfordert keine Azure-Anmeldedaten.
Kann diese Fähigkeit tatsächliche Datenoperationen ausführen?
Nein, diese Fähigkeit generiert Python-Code und bietet Anleitung. Sie führt keine Operationen gegen Azure aus. Sie müssen den generierten Code in Ihrer eigenen Umgebung mit entsprechenden Azure-Anmeldedaten ausführen.
Welche Python-Pakete werden benötigt?
Das Hauptpaket ist azure-storage-file-datalake. Möglicherweise benötigen Sie auch azure-identity für die Authentifizierung. Installieren Sie mit: pip install azure-storage-file-datalake azure-identity
Wie handhabe ich die Authentifizierung sicher?
Verwenden Sie Azure Managed Identities bei Ausführung in Azure, Azure AD-Dienstprinzipale für Anwendungen oder SAS-Token für eingeschränkten Zugriff. Speichern Sie niemals Kontoschlüssel im Code. Verwenden Sie Umgebungsvariablen oder Azure Key Vault für die Anmeldedatenspeicherung.

Entwicklerdetails

Dateistruktur

📄 SKILL.md