Azure Data Lake Storage Gen2 SDK for Python
Trabajar con Azure Data Lake Storage en Python
Esta habilidad permite a Claude interactuar con Azure Data Lake Storage Gen2 usando el SDK de Python, proporcionando operaciones de archivos, gestión de directorios y capacidades de control de acceso para flujos de trabajo de datos en la nube.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "Azure Data Lake Storage Gen2 SDK for Python". ¿Cómo creo un nuevo sistema de archivos en Azure Data Lake Gen2?
Resultado esperado:
- Para crear un sistema de archivos (contenedor) en Azure Data Lake Gen2:
- 1. Usa DataLakeServiceClient para conectarte a tu cuenta de almacenamiento
- 2. Llama al método create_file_system()
- Ejemplo de código:
- ```python
- from azure.storage.filedatalake import DataLakeServiceClient
- def create_datalake_filesystem(storage_account_name, sas_token):
- service_client = DataLakeServiceClient(
- account_url=f"https://{storage_account_name}.dfs.core.windows.net",
- credential=sas_token
- )
- filesystem_client = service_client.create_file_system('my-container')
- return filesystem_client
- ```
Usando "Azure Data Lake Storage Gen2 SDK for Python". ¿Cuáles son las mejores prácticas para organizar datos en Data Lake?
Resultado esperado:
- Mejores prácticas para organización de Azure Data Lake:
- 1. **Usar espacio de nombres jerárquico** - Habilitar al crear para rutas compatibles con HDFS
- 2. **Seguir convenciones de nombres** - Usar minúsculas, guiones, formatos de fecha consistentes
- 3. **Implementar almacenamiento por niveles** - Usar políticas de ciclo de vida para niveles hot/warm/cold
- 4. **Configurar ACLs apropiados** - Otorgar permisos mínimos requeridos
- 5. **Particionar sabiamente** - Organizar por campos comúnmente consultados como fecha/región
Usando "Azure Data Lake Storage Gen2 SDK for Python". ¿Cómo configuro permisos de acceso para un directorio?
Resultado esperado:
- Para configurar ACLs en Azure Data Lake Gen2:
- 1. Obtener el cliente de directorio usando get_directory_client()
- 2. Usar set_access_control() para establecer permisos estilo POSIX
- 3. O usar update_access_control_recursive() para actualizaciones por lotes
- Los permisos siguen el formato POSIX: owner:group:permissions
- Ejemplo: 'user::rwx,group::r-x,other::r--'
Auditoría de seguridad
SeguroStatic analysis scanned 0 files (0 lines) and detected 0 potential security issues. This is a prompt-only skill with no executable code. The skill provides descriptions and context for Azure Data Lake Storage Gen2 SDK usage without executing any operations. Risk score: 0/100.
Puntuación de calidad
Lo que puedes crear
Ingeniero de datos en la nube gestionando pipelines de datos
Generar código Python para mover datos entre sistemas locales y Azure Data Lake para pipelines ETL
Desarrollador construyendo aplicaciones serverless
Crear y configurar almacenamiento de Azure Data Lake para aplicaciones serverless con controles de acceso apropiados
Científico de datos organizando conjuntos de datos
Estructurar y organizar conjuntos de datos de machine learning en Azure Data Lake con jerarquía apropiada
Prueba estos prompts
Show me how to list all files in an Azure Data Lake Gen2 directory using the Python SDK
Generate Python code to upload a file to Azure Data Lake Storage with specific ACL permissions
Help me create a nested directory structure in Azure Data Lake Gen2 for organizing data by date and category
Create a Python script to migrate a large folder from local storage to Azure Data Lake Gen2 with proper error handling and logging
Mejores prácticas
- Habilitar siempre espacio de nombres jerárquico al crear nuevas cuentas de Data Lake para compatibilidad con HDFS
- Usar identidades administradas o Key Vault para gestión de credenciales en lugar de codificar secretos
- Implementar manejo adecuado de errores y lógica de reintento para operaciones de datos de producción
Evitar
- No codificar en duro las claves de cuenta de almacenamiento de Azure en el código fuente - usar variables de entorno o Azure Key Vault
- Evitar otorgar permisos demasiado amplios - seguir el principio de mínimo privilegio para ACLs
- No subir datos sensibles sin habilitar cifrado en reposo y usar controles de acceso apropiados
Preguntas frecuentes
¿Qué es Azure Data Lake Storage Gen2?
¿En qué se diferencia esta habilidad de Azure Blob Storage?
¿Necesito una suscripción de Azure para usar esta habilidad?
¿Puede esta habilidad ejecutar operaciones de datos reales?
¿Qué paquetes de Python son requeridos?
¿Cómo manejo la autenticación de forma segura?
Detalles del desarrollador
Autor
sickn33Licencia
MIT
Repositorio
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-storage-file-datalake-pyRef.
main
Estructura de archivos
📄 SKILL.md