Habilidades Azure Data Lake Storage Gen2 SDK for Python
📦

Azure Data Lake Storage Gen2 SDK for Python

Seguro

Trabajar con Azure Data Lake Storage en Python

Esta habilidad permite a Claude interactuar con Azure Data Lake Storage Gen2 usando el SDK de Python, proporcionando operaciones de archivos, gestión de directorios y capacidades de control de acceso para flujos de trabajo de datos en la nube.

Soporta: Claude Codex Code(CC)
🥉 72 Bronce
1

Descargar el ZIP de la skill

2

Subir en Claude

Ve a Configuración → Capacidades → Skills → Subir skill

3

Activa y empieza a usar

Pruébalo

Usando "Azure Data Lake Storage Gen2 SDK for Python". ¿Cómo creo un nuevo sistema de archivos en Azure Data Lake Gen2?

Resultado esperado:

  • Para crear un sistema de archivos (contenedor) en Azure Data Lake Gen2:
  •  
  • 1. Usa DataLakeServiceClient para conectarte a tu cuenta de almacenamiento
  • 2. Llama al método create_file_system()
  •  
  • Ejemplo de código:
  • ```python
  • from azure.storage.filedatalake import DataLakeServiceClient
  •  
  • def create_datalake_filesystem(storage_account_name, sas_token):
  • service_client = DataLakeServiceClient(
  • account_url=f"https://{storage_account_name}.dfs.core.windows.net",
  • credential=sas_token
  • )
  • filesystem_client = service_client.create_file_system('my-container')
  • return filesystem_client
  • ```

Usando "Azure Data Lake Storage Gen2 SDK for Python". ¿Cuáles son las mejores prácticas para organizar datos en Data Lake?

Resultado esperado:

  • Mejores prácticas para organización de Azure Data Lake:
  •  
  • 1. **Usar espacio de nombres jerárquico** - Habilitar al crear para rutas compatibles con HDFS
  • 2. **Seguir convenciones de nombres** - Usar minúsculas, guiones, formatos de fecha consistentes
  • 3. **Implementar almacenamiento por niveles** - Usar políticas de ciclo de vida para niveles hot/warm/cold
  • 4. **Configurar ACLs apropiados** - Otorgar permisos mínimos requeridos
  • 5. **Particionar sabiamente** - Organizar por campos comúnmente consultados como fecha/región

Usando "Azure Data Lake Storage Gen2 SDK for Python". ¿Cómo configuro permisos de acceso para un directorio?

Resultado esperado:

  • Para configurar ACLs en Azure Data Lake Gen2:
  •  
  • 1. Obtener el cliente de directorio usando get_directory_client()
  • 2. Usar set_access_control() para establecer permisos estilo POSIX
  • 3. O usar update_access_control_recursive() para actualizaciones por lotes
  •  
  • Los permisos siguen el formato POSIX: owner:group:permissions
  • Ejemplo: 'user::rwx,group::r-x,other::r--'

Auditoría de seguridad

Seguro
v1 • 2/25/2026

Static analysis scanned 0 files (0 lines) and detected 0 potential security issues. This is a prompt-only skill with no executable code. The skill provides descriptions and context for Azure Data Lake Storage Gen2 SDK usage without executing any operations. Risk score: 0/100.

0
Archivos escaneados
0
Líneas analizadas
0
hallazgos
1
Auditorías totales
No se encontraron problemas de seguridad
Auditado por: claude

Puntuación de calidad

38
Arquitectura
100
Mantenibilidad
87
Contenido
50
Comunidad
100
Seguridad
74
Cumplimiento de la especificación

Lo que puedes crear

Ingeniero de datos en la nube gestionando pipelines de datos

Generar código Python para mover datos entre sistemas locales y Azure Data Lake para pipelines ETL

Desarrollador construyendo aplicaciones serverless

Crear y configurar almacenamiento de Azure Data Lake para aplicaciones serverless con controles de acceso apropiados

Científico de datos organizando conjuntos de datos

Estructurar y organizar conjuntos de datos de machine learning en Azure Data Lake con jerarquía apropiada

Prueba estos prompts

Listar archivos en un directorio
Show me how to list all files in an Azure Data Lake Gen2 directory using the Python SDK
Subir archivo con control de acceso
Generate Python code to upload a file to Azure Data Lake Storage with specific ACL permissions
Crear estructura de directorios jerárquica
Help me create a nested directory structure in Azure Data Lake Gen2 for organizing data by date and category
Implementar script de migración de datos
Create a Python script to migrate a large folder from local storage to Azure Data Lake Gen2 with proper error handling and logging

Mejores prácticas

  • Habilitar siempre espacio de nombres jerárquico al crear nuevas cuentas de Data Lake para compatibilidad con HDFS
  • Usar identidades administradas o Key Vault para gestión de credenciales en lugar de codificar secretos
  • Implementar manejo adecuado de errores y lógica de reintento para operaciones de datos de producción

Evitar

  • No codificar en duro las claves de cuenta de almacenamiento de Azure en el código fuente - usar variables de entorno o Azure Key Vault
  • Evitar otorgar permisos demasiado amplios - seguir el principio de mínimo privilegio para ACLs
  • No subir datos sensibles sin habilitar cifrado en reposo y usar controles de acceso apropiados

Preguntas frecuentes

¿Qué es Azure Data Lake Storage Gen2?
Azure Data Lake Storage Gen2 es un servicio de almacenamiento en la nube construido sobre Azure Blob Storage que proporciona semántica de sistema de archivos, seguridad y escalabilidad para cargas de trabajo de análisis de big data. Combina las capacidades de Azure Blob Storage con características de Data Lake incluyendo espacio de nombres jerárquico y control de acceso compatible con POSIX.
¿En qué se diferencia esta habilidad de Azure Blob Storage?
Mientras que Blob Storage es almacenamiento de objetos de propósito general, Data Lake Gen2 añade soporte de espacio de nombres jerárquico para estructuras de directorios compatibles con HDFS, ACLs estilo POSIX y rendimiento optimizado para cargas de trabajo analíticas. Usa Data Lake Gen2 para análisis de big data; usa Blob Storage para necesidades de almacenamiento de objetos general.
¿Necesito una suscripción de Azure para usar esta habilidad?
Esta habilidad genera código Python y proporciona orientación para operaciones de Azure Data Lake. Para ejecutar el código, necesitas una suscripción de Azure válida con una cuenta de Data Lake Storage Gen2. La habilidad en sí no requiere credenciales de Azure.
¿Puede esta habilidad ejecutar operaciones de datos reales?
No, esta habilidad genera código Python y proporciona orientación. No ejecuta operaciones contra Azure. Necesitarás ejecutar el código generado en tu propio entorno con credenciales de Azure apropiadas.
¿Qué paquetes de Python son requeridos?
El paquete principal es azure-storage-file-datalake. También puedes necesitar azure-identity para autenticación. Instalar con: pip install azure-storage-file-datalake azure-identity
¿Cómo manejo la autenticación de forma segura?
Usa Azure Managed Identities al ejecutar en Azure, service principals de Azure AD para aplicaciones, o tokens SAS para acceso limitado. Nunca almacenes claves de cuenta en el código. Usa variables de entorno o Azure Key Vault para almacenamiento de credenciales.

Detalles del desarrollador

Estructura de archivos

📄 SKILL.md