machine-learning-ops-ml-pipeline
使用多元代理 MLOps 建構生產級 ML 管線
機器學習團隊在將模型正式上線時,常面臨基礎設施和監控不足的問題。此技能能協調專業的 AI 代理程式,從資料工程到部署和持續監控,設計完整的 ML 管線。
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「machine-learning-ops-ml-pipeline」。 Build ML pipeline for fraud detection with real-time inference requirements
預期結果:
- Data Pipeline: Kafka streaming ingestion with schema validation, feature computation using Flink, Redis for low-latency feature serving
- Model Training: XGBoost with time-series cross-validation, hyperparameter tuning via Optuna, MLflow experiment tracking
- Serving: KServe on Kubernetes with GPU acceleration, <50ms p99 latency SLO, automatic model warm-up
- Monitoring: Real-time drift detection using PSI, automated retraining triggers, Grafana dashboards for fraud metrics
正在使用「machine-learning-ops-ml-pipeline」。 Set up experiment tracking and model registry for computer vision team
預期結果:
- Experiment Tracking: MLflow with custom logging for images, metrics, and model architectures. Integration with PyTorch Lightning callbacks.
- Model Registry: Staging workflow with automated validation tests, model comparison tools, and one-click deployment to staging environment.
- Collaboration: Shared dashboards for team visibility, experiment tagging for reproducibility, artifact lineage tracking.
安全審計
安全This skill is documentation-only containing markdown content and prompt templates for ML pipeline orchestration. All static analysis findings were false positives: backticks at line 27 are markdown formatting for file references, 'blocker' matches are not cryptographic code, and 'reconnaissance' match is a configuration option label. No executable code, network calls, file operations, or secret handling detected.
品質評分
你能建構什麼
資料科學團隊主管
協調新客戶流失預測模型的端對端 ML 管線開發,協調資料工程師建構特徵管線、資料科學家進行模型實驗,以及 MLOps 工程師在 Kubernetes 上進行生產部署。
ML 平台工程師
設計並實作標準化的 MLOps 基礎設施,包括實驗追蹤、模型註冊、自動化重新訓練管線,以及為組織內多個 ML 團隊設定全面的監控。
新創公司技術長
從頭建構生產就緒的 ML 服務基礎設施,進行成本優化、自動擴展、藍綠部署和可觀測性,以支援新的推薦引擎功能。
試試這些提示
為 [use case] 設計基本 ML 管線,包括資料擷取、模型訓練和 API 服務。專注於必要元件並提供高階架構圖。
使用 Feast 為 [domain] 設計特徵商店。包括資料來源連線、特徵定義、轉換邏輯、線上/離線商店配置,以及與訓練和服務管線的整合。
為 Kubernetes 上的 [model type] 模型建立完整部署策略。包括 KServe 配置、HPA 自動擴展規則、Istio 流量管理進行金絲雀發布、監控指標和回滾程序。
為 [organization size] 架構企業級 MLOps 平台。涵蓋使用 MLflow 的多團隊實驗追蹤、集中式特徵商店、具審批工作流程的模型註冊、自動化重新訓練觸發、漂移偵測和團隊成本分配。
最佳實務
- 使用 Git 和 DVC 對所有管線成果物進行版本控制,包括資料結構描述、模型配置和基礎設施程式碼,以確保可重現性
- 在每個管線階段實作全面的驗證閘道:資料品質檢查、模型效能閾值,以及升級前的基礎設施健康檢查
- 從一開始就設計可觀測性,採用結構化日誌、分散式追蹤和業務指標關聯,以實現快速事件回應
避免
- 訓練與服務偏差:在訓練和生產中使用不同的特徵計算邏輯,導致模型效能意外下降
- 手動模型部署:依賴手動流程進行模型升級,而非使用驗證閾道的自動化 CI/CD 管線
- 監控盲點:僅追蹤系統指標,而未監控資料漂移、概念漂移或業務 KPI 關聯