Crear pipelines de ML confiables requiere orquestar las etapas de preparación de datos, entrenamiento, validación y despliegue mientras se mantiene la reproducibilidad y el monitoreo. Esta habilidad proporciona patrones probados y mejores prácticas para crear flujos de trabajo MLOps de extremo a extremo que escalan desde el prototipo hasta la producción.
Descargar el ZIP de la skill
Subir en Claude
Ve a Configuración → Capacidades → Skills → Subir skill
Activa y empieza a usar
Pruébalo
Usando "ml-pipeline-workflow". Diseñar un pipeline de ML básico para clasificación de imágenes
Resultado esperado:
Aquí hay una arquitectura de pipeline de 4 etapas: Etapa 1 - Ingestión de datos (cargar imágenes, dividir train/val/test), Etapa 2 - Ingeniería de características (aumentación, normalización), Etapa 3 - Entrenamiento del modelo (entrenar CNN con registro de hiperparámetros), Etapa 4 - Despliegue (empaquetar modelo, desplegar a endpoint de serve). Cada etapa tiene lógica de reintento independiente y artefactos versionados de salida.
Usando "ml-pipeline-workflow". ¿Cómo implemento deployment canary para mi modelo?
Resultado esperado:
Estrategia de deployment canary: 1) Desplegar nuevo modelo al 10% del tráfico usando enrutamiento ponderado, 2) Monitorear métricas clave (latencia, tasa de error, calidad de predicciones) por 1-2 horas, 3) Si las métricas se mantienen dentro de los umbrales, aumentar gradualmente al 50%, luego al 100%, 4) Si se detectan anomalías, hacer rollback automático al modelo anterior. Usar MLflow o similar para rastrear versiones y rendimiento del modelo.
Auditoría de seguridad
SeguroStatic analysis detected 17 potential issues (external_commands and weak cryptographic patterns), all of which are false positives. The flagged backtick patterns are markdown code formatting for file path references (e.g., `resources/implementation-playbook.md`), not shell execution. The cryptographic algorithm flags do not correspond to actual cryptographic code in the skill file. This is a documentation-only skill with no executable code, no network access, no file system operations, and no security risks.
Problemas de riesgo bajo (1)
Puntuación de calidad
Lo que puedes crear
Crear Nuevo Pipeline de ML
Crear un pipeline de ML completo desde cero con orquestación, validación y etapas de despliegue adecuadas para un sistema de aprendizaje automático en producción.
Orquestar Flujos de Trabajo de ML
Diseñar e implementar automatización de workflows basada en DAG para componentes de ML existentes usando herramientas como Airflow, Dagster o Kubeflow Pipelines.
Desplegar Modelos en Producción
Implementar estrategias de despliegue seguras incluyendo releases canary, despliegues blue-green y mecanismos de rollback automatizado para modelos de ML.
Prueba estos prompts
Diseñar un pipeline de ML simple que procese datos, entrene un modelo y lo despliegue. Incluir las etapas clave y las dependencias.
Ayúdame a configurar un workflow de ML basado en DAG usando [Airflow/Dagster/Kubeflow]. Tengo etapas de [procesamiento de datos/entrenamiento/validación] que necesitan ejecutarse en secuencia.
Diseñar una estrategia de despliegue para mi modelo de ML que incluya pruebas canary y rollback automatizado. El modelo sirve predicciones de [descripción].
Crear un pipeline de entrenamiento continuo que reentrene mi modelo cuando se detecte drift de datos. Incluir disparadores de monitoreo y gates de validación.
Mejores prácticas
- Diseñar cada etapa del pipeline para que sea modular e independientemente testeable para facilitar el depurado y mantenimiento
- Implementar etapas idempotentes de modo que volver a ejecutar cualquier parte del pipeline sea seguro y produzca resultados consistentes
- Versionar todos los artefactos incluyendo datasets, modelos y configuraciones para reproducibilidad completa y capacidades de rollback
Evitar
- Evitar etapas de pipeline monoliticas que combinen múltiples responsabilidades, ya que esto dificulta el depurado y reduce la reutilización
- No saltarse la validación de datos entre etapas, ya que datos inválidos pueden causar fallos silenciosos posteriores que son difíciles de diagnosticar
- Nunca desplegar modelos directamente al 100% del tráfico de producción sin pruebas de validación o mecanismos de rollout gradual
Preguntas frecuentes
¿Qué herramienta de orquestación debo usar para mi pipeline de ML?
¿Cómo manejo el versionado de datos en mi pipeline?
¿Cuál es la diferencia entre pipelines de características por lotes y en tiempo real?
¿Cómo monitoreo el rendimiento del modelo después del despliegue?
¿Cuándo debo usar deployment canary vs blue-green?
¿Cómo implemento disparadores de rollback automatizado?
Detalles del desarrollador
Autor
sickn33Licencia
MIT
Repositorio
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/ml-pipeline-workflowRef.
main
Estructura de archivos
📄 SKILL.md