المهارات Azure Data Lake Storage Gen2 SDK for Python
📦

Azure Data Lake Storage Gen2 SDK for Python

آمن

使用 Python 操作 Azure Data Lake Storage

此技能使 Claude 能够使用 Python SDK 与 Azure Data Lake Storage Gen2 进行交互,提供文件操作、目录管理和访问控制功能,支持云数据工作流。

يدعم: Claude Codex Code(CC)
🥉 72 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "Azure Data Lake Storage Gen2 SDK for Python". How do I create a new file system in Azure Data Lake Gen2?

النتيجة المتوقعة:

  • 要在 Azure Data Lake Gen2 中创建文件系统(容器):
  •  
  • 1. 使用 DataLakeServiceClient 连接到存储账户
  • 2. 调用 create_file_system() 方法
  •  
  • 示例代码:
  • ```python
  • from azure.storage.filedatalake import DataLakeServiceClient
  •  
  • def create_datalake_filesystem(storage_account_name, sas_token):
  • service_client = DataLakeServiceClient(
  • account_url=f"https://{storage_account_name}.dfs.core.windows.net",
  • credential=sas_token
  • )
  • filesystem_client = service_client.create_file_system('my-container')
  • return filesystem_client
  • ```

استخدام "Azure Data Lake Storage Gen2 SDK for Python". What are best practices for organizing data in Data Lake?

النتيجة المتوقعة:

  • Azure Data Lake 组织最佳实践:
  •  
  • 1. **使用分层命名空间** - 创建时启用以获得 HDFS 兼容路径
  • 2. **遵循命名规范** - 使用小写字母、连字符、一致的日期格式
  • 3. **实施分层存储** - 使用生命周期策略管理热/温/冷层级
  • 4. **设置适当的 ACL** - 授予最低所需权限
  • 5. **明智地分区** - 按常用查询字段(如日期/区域)组织

استخدام "Azure Data Lake Storage Gen2 SDK for Python". How do I configure access permissions for a directory?

النتيجة المتوقعة:

  • 要在 Azure Data Lake Gen2 上配置 ACL:
  •  
  • 1. 使用 get_directory_client() 获取目录客户端
  • 2. 使用 set_access_control() 设置 POSIX 风格权限
  • 3. 或使用 update_access_control_recursive() 进行批量更新
  •  
  • 权限遵循 POSIX 格式:owner:group:permissions
  • 示例: 'user::rwx,group::r-x,other::r--'

التدقيق الأمني

آمن
v1 • 2/25/2026

Static analysis scanned 0 files (0 lines) and detected 0 potential security issues. This is a prompt-only skill with no executable code. The skill provides descriptions and context for Azure Data Lake Storage Gen2 SDK usage without executing any operations. Risk score: 0/100.

0
الملفات التي تم فحصها
0
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
50
المجتمع
100
الأمان
74
الامتثال للمواصفات

ماذا يمكنك بناءه

管理数据管道的云数据工程师

生成 Python 代码以在本地系统和 Azure Data Lake 之间移动数据,用于 ETL 管道

开发无服务器应用程序

为无服务器应用创建和配置 Azure Data Lake 存储,并设置适当的访问控制

数据集组织的数据科学家

在 Azure Data Lake 中使用适当的层次结构构建和组织机器学习数据集

جرّب هذه الموجهات

列出目录中的文件
展示如何使用 Python SDK 列出 Azure Data Lake Gen2 目录中的所有文件
上传文件并设置访问控制
生成 Python 代码以将文件上传到 Azure Data Lake Storage 并设置特定的 ACL 权限
创建分层目录结构
帮助我在 Azure Data Lake Gen2 中创建嵌套目录结构,按日期和类别组织数据
实现数据迁移脚本
创建 Python 脚本以将大型文件夹从本地存储迁移到 Azure Data Lake Gen2,并包含适当的错误处理和日志记录

أفضل الممارسات

  • 创建新的 Data Lake 账户时,始终启用分层命名空间以获得 HDFS 兼容性
  • 使用托管标识或密钥保管库进行凭据管理,而不是将密钥硬编码在代码中
  • 为生产数据操作实施适当的错误处理和重试逻辑

تجنب

  • 不要将 Azure 存储账户密钥硬编码在源代码中 - 使用环境变量或 Azure 密钥保管库
  • 避免授予过宽的权限 - 遵循最小权限原则设置 ACL
  • 不要在未启用静态加密和未设置适当访问控制的情况下上传敏感数据

الأسئلة المتكررة

什么是 Azure Data Lake Storage Gen2?
Azure Data Lake Storage Gen2 是基于 Azure Blob Storage 构建的云存储服务,提供文件系统语义、安全性和大数据分析工作流的可扩展性。它结合了 Azure Blob Storage 的功能与数据湖特性,包括分层命名空间和 POSIX 兼容访问控制。
此技能与 Azure Blob Storage 有什么区别?
虽然 Blob Storage 是通用对象存储,但 Data Lake Gen2 增加了分层命名空间支持,可实现 HDFS 兼容的目录结构、POSIX 风格 ACL,并针对分析工作流进行了性能优化。将 Data Lake Gen2 用于大数据分析;将 Blob Storage 用于通用对象存储需求。
使用此技能是否需要 Azure 订阅?
此技能生成 Python 代码并提供 Azure Data Lake 操作指导。要执行该代码,您需要有效的 Azure 订阅和 Data Lake Storage Gen2 账户。该技能本身不需要 Azure 凭据。
此技能能否执行实际的数据操作?
不,此技能生成 Python 代码并提供指导。它不会对 Azure 执行实际操作。您需要在自己的环境中使用适当的 Azure 凭据运行生成的代码。
需要哪些 Python 包?
主要包是 azure-storage-file-datalake。您可能还需要 azure-identity 进行身份验证。安装方式:pip install azure-storage-file-datalake azure-identity
如何安全处理身份验证?
在 Azure 中运行时使用 Azure 托管标识,应用程序使用 Azure AD 服务主体,或使用 SAS 令牌进行有限访问。切勿将账户密钥存储在代码中。使用环境变量或 Azure 密钥保管库存储凭据。

تفاصيل المطور

بنية الملفات

📄 SKILL.md