Azure Data Lake Storage Gen2 SDK for Python
Python で Azure Data Lake Storage を操作する
このスキルは、Python SDK を使用して Azure Data Lake Storage Gen2 と対話できるようにし、ファイル操作、ディレクトリ管理、アクセス制御機能を提供して、クラウドデータワークフローをサポートします。
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "Azure Data Lake Storage Gen2 SDK for Python". Azure Data Lake Gen2 で新しいファイルシステムを作成するにはどうすればよいですか?
النتيجة المتوقعة:
- Azure Data Lake Gen2 でファイルシステム (コンテナ) を作成するには:
- 1. DataLakeServiceClient を使用してストレージアカウントに接続
- 2. create_file_system() メソッドを呼び出す
- コード例:
- ```python
- from azure.storage.filedatalake import DataLakeServiceClient
- def create_datalake_filesystem(storage_account_name, sas_token):
- service_client = DataLakeServiceClient(
- account_url=f"https://{storage_account_name}.dfs.core.windows.net",
- credential=sas_token
- )
- filesystem_client = service_client.create_file_system('my-container')
- return filesystem_client
- ```
استخدام "Azure Data Lake Storage Gen2 SDK for Python". Data Lake でデータを整理するためのベストプラクティスは何ですか?
النتيجة المتوقعة:
- Azure Data Lake 整理のベストプラクティス:
- 1. **階層型名前空間を有効化** - HDFS 互換パスのために作成時に有効化
- 2. **命名規則に従う** - 小文字、ハイフン、一貫した日付形式を使用
- 3. **階層型ストレージを実装** - ホット/ウォーム/コールド層にライフサイクルポリシーを使用
- 4. **適切な ACL を設定** - 必要最小限の権限を付与
- 5. **賢くパーティショニング** - 日付やリージョンなど、一般的にクエリされるフィールドで整理
استخدام "Azure Data Lake Storage Gen2 SDK for Python". ディレクトリのアクセス権限を構成するにはどうすればよいですか?
النتيجة المتوقعة:
- Azure Data Lake Gen2 で ACL を構成するには:
- 1. get_directory_client() を使用してディレクトリクライアントを取得
- 2. set_access_control() を使用して POSIX スタイルの権限を設定
- 3. またはバッチ更新には update_access_control_recursive() を使用
- 権限は POSIX 形式に従います:owner:group:permissions
- 例:'user::rwx,group::r-x,other::r--'
التدقيق الأمني
آمنStatic analysis scanned 0 files (0 lines) and detected 0 potential security issues. This is a prompt-only skill with no executable code. The skill provides descriptions and context for Azure Data Lake Storage Gen2 SDK usage without executing any operations. Risk score: 0/100.
درجة الجودة
ماذا يمكنك بناءه
データパイプラインを管理するクラウドデータエンジニア
ETL パイプラインのためにローカルシステムと Azure Data Lake 間でデータを移動する Python コードを生成
サーバーレスアプリケーションを構築する開発者
適切なアクセス制御を備えたサーバーレスアプリ向けに Azure Data Lake ストレージを作成および構成
データセットを整理するデータサイエンティスト
適切な階層構造で Azure Data Lake に機械学習データセットを構造化および整理
جرّب هذه الموجهات
Python SDK を使用して Azure Data Lake Gen2 ディレクトリ内のすべてのファイルを一覧表示する方法を示してください
特定の ACL 権限を付けてファイルを Azure Data Lake Storage にアップロードする Python コードを生成してください
日付とカテゴリ別にデータを整理するための Azure Data Lake Gen2 におけるネストされたディレクトリ構造の作成を支援してください
適切なエラーハンドリングとログ記録を備えた、ローカルストレージから Azure Data Lake Gen2 への大規模フォルダの移行用 Python スクリプトを作成してください
أفضل الممارسات
- HDFS 互換性のために新しい Data Lake アカウントを作成する際は、常に階層型名前空間を有効化する
- 機密情報をハードコーディングする代わりに、資格情報管理にマネージド ID または Key Vault を使用する
- 本番環境のデータ操作には適切なエラーハンドリングと再試行ロジックを実装する
تجنب
- ソースコードに Azure ストレージアカウントキーをハードコーディングしない - 環境変数または Azure Key Vault を使用する
- 過度に広範な権限の付与は避ける - ACL には最小権限の原則に従う
- 適切なアクセス制御と保存時の暗号化を有効にせずに機密データをアップロードしない