المهارات mlops-engineer
⚙️

mlops-engineer

آمن

Créer des pipelines ML de production

La création et la maintenance de pipelines ML nécessitent une expertise dans plusieurs outils et plateformes cloud. Cette compétence fournit des conseils experts pour mettre en œuvre des workflows MLOps de bout en bout avec le suivi des expériences, la versioning des modèles et le déploiement automatisé.

يدعم: Claude Codex Code(CC)
🥉 74 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "mlops-engineer". Design a basic ML pipeline using Kubeflow

النتيجة المتوقعة:

  • Pipeline Structure: Data Ingestion → Preprocessing → Training → Evaluation → Model Registration
  • Each component runs as a Docker container with appropriate resource limits
  • MLflow integrated for tracking metrics and artifacts across all stages
  • Pipeline parameters defined for data paths, model hyperparameters, and thresholds

استخدام "mlops-engineer". How do I set up model versioning with MLflow?

النتيجة المتوقعة:

  • 1. Register model in MLflow Model Registry with unique version
  • 2. Add model metadata including description and training parameters
  • 3. Configure stage transitions: None → Staging → Production
  • 4. Implement approval workflow for production promotions
  • 5. Set up webhooks for notifications on model updates

التدقيق الأمني

آمن
v1 • 2/25/2026

Prompt-only skill with no executable code. Static analysis scanned 0 files and detected 0 security issues. The skill provides MLOps guidance through text-based instructions only. No network requests, file system access, or external commands. Risk score: 0/100.

0
الملفات التي تم فحصها
0
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
50
المجتمع
100
الأمان
91
الامتثال للمواصفات

ماذا يمكنك بناءه

Concevoir l'architecture de la plateforme ML

Créer une conception complète de plateforme MLOps pour une entreprise ayant besoin de déployer des modèles à grande échelle avec le suivi des expériences et la versioning des modèles.

Implémenter un pipeline de réentraînement automatisé

Construire un pipeline automatisé qui réentraîne les modèles lorsque une dérive de données est détectée, avec des workflows d'approbation et des capacités de rollback.

Configurer l'infrastructure ML multi-cloud

Mettre en place une infrastructure ML sur AWS, Azure et GCP avec des outils cohérents et des capacités de reprise après sinistre.

جرّب هذه الموجهات

Configuration de base du pipeline ML
Concevoir un pipeline ML de base utilisant Kubeflow qui inclut les étapes de prétraitement des données, d'entraînement du modèle et d'évaluation du modèle. Inclure la configuration pour le suivi des expériences avec MLflow.
Configuration du suivi des expériences
Configurer le suivi des expériences MLflow pour un projet d'entraînement PyTorch. Inclure la configuration pour l'enregistrement des métriques, le stockage des artefacts et la versioning des modèles.
Architecture de déploiement en production
Concevoir une architecture de déploiement ML en production sur AWS SageMaker avec la mise à l'échelle automatique, la surveillance et les capacités de déploiement blue-green. Inclure des stratégies d'optimisation des coûts.
Plateforme MLOps complète
Concevoir une architecture de plateforme MLOps complète incluant : le feature store, le suivi des expériences, le pipeline CI/CD, la surveillance, le registre de modèles, la détection de dérive. Spécifier les outils et les points d'intégration pour AWS ou GCP.

أفضل الممارسات

  • Commencez par le suivi des expériences avant de construire des pipelines complexes pour comprendre le comportement des données et des modèles
  • Implémentez la surveillance et les alertes dès le déploiement initial, pas après coup
  • Utilisez l'infrastructure en tant que code (Terraform, CloudFormation) pour des environnements ML reproductibles

تجنب

  • Déployer des modèles sans tests automatisés ou portes de validation
  • Ignorer les contrôles de qualité des données avant l'entraînement du modèle conduit à de mauvaises performances du modèle
  • Utiliser un seul fournisseur cloud sans considérer le verrouillage fournisseur pour les systèmes ML critiques

الأسئلة المتكررة

Qu'est-ce que MLOps ?
MLOps (Machine Learning Operations) est la pratique de déployer et maintenir les modèles ML en production de manière fiable et efficace. Elle combine ML, DevOps et l'ingénierie des données pour automatiser le cycle de vie du ML.
Quel outil de suivi des expériences dois-je utiliser ?
MLflow est open-source et s'intègre largement. Weights & Biases offre d'excellentes visualisations. Choisissez en fonction de la taille de l'équipe, du budget et des fonctionnalités requises. De nombreuses équipes commencent avec MLflow et passent à une solution plus complète au fur et à mesure de la croissance de leurs besoins.
Comment gérer les mises à jour des modèles en production ?
Utilisez des déploiements canary ou des stratégies blue-green. Surveillez de près les performances du nouveau modèle. Implémentez un rollback automatique si les métriques se dégradent. Maintenez toujours la version précédente du modèle fonctionnel pour une récupération rapide.
Qu'est-ce qu'un feature store ?
Un feature store est un répertoire centralisé pour stocker, gérer et servir les features ML. Il assure la cohérence entre l'entraînement et l'inférence, permet le partage des features entre les équipes et gère le calcul des features pour les cas d'utilisation par lots et en temps réel.
Comment surveiller les modèles ML en production ?
Surveillez trois domaines clés : la qualité des données (décalages de distribution), les performances du modèle (précision, latence) et les métriques métier. Utilisez des outils comme Prometheus, Grafana ou la surveillance native du cloud. Configurez des alertes pour la détection de dérive et la dégradation des performances.
Cette compétence peut-elle m'aider avec le déploiement ML sur site ?
Oui. La compétence couvre les déploiements basés sur Kubernetes, Kubeflow et l'orchestration de conteneurs qui fonctionnent aussi bien sur site que dans les environnements cloud. Elle aborde également les architectures cloud hybrides.

تفاصيل المطور

المؤلف

sickn33

الترخيص

MIT

مرجع

main

بنية الملفات

📄 SKILL.md