技能 machine-learning-ops-ml-pipeline

📦

machine-learning-ops-ml-pipeline

Name: machine-learning-ops-ml-pipeline
Author: sickn33

安全

使用多元代理 MLOps 建構生產級 ML 管線

機器學習團隊在將模型正式上線時，常面臨基礎設施和監控不足的問題。此技能能協調專業的 AI 代理程式，從資料工程到部署和持續監控，設計完整的 ML 管線。

支援: Claude Codex Code(CC)

📊 70 充足

下載技能 ZIP

在 Claude 中上傳

前往設定 → 功能 → 技能 → 上傳技能

開啟並開始使用

測試它

正在使用「machine-learning-ops-ml-pipeline」。 Build ML pipeline for fraud detection with real-time inference requirements

預期結果:

Data Pipeline: Kafka streaming ingestion with schema validation, feature computation using Flink, Redis for low-latency feature serving
Model Training: XGBoost with time-series cross-validation, hyperparameter tuning via Optuna, MLflow experiment tracking
Serving: KServe on Kubernetes with GPU acceleration, <50ms p99 latency SLO, automatic model warm-up
Monitoring: Real-time drift detection using PSI, automated retraining triggers, Grafana dashboards for fraud metrics

正在使用「machine-learning-ops-ml-pipeline」。 Set up experiment tracking and model registry for computer vision team

預期結果:

Experiment Tracking: MLflow with custom logging for images, metrics, and model architectures. Integration with PyTorch Lightning callbacks.
Model Registry: Staging workflow with automated validation tests, model comparison tools, and one-click deployment to staging environment.
Collaboration: Shared dashboards for team visibility, experiment tagging for reproducibility, artifact lineage tracking.

安全審計

安全

v1 • 2/25/2026

This skill is documentation-only containing markdown content and prompt templates for ML pipeline orchestration. All static analysis findings were false positives: backticks at line 27 are markdown formatting for file references, 'blocker' matches are not cryptographic code, and 'reconnaissance' match is a configuration option label. No executable code, network calls, file operations, or secret handling detected.

已掃描檔案

317

分析行數

發現項

審計總數

未發現安全問題

審計者: claude

品質評分

架構

100

可維護性

內容

社群

100

安全

規範符合性

你能建構什麼

資料科學團隊主管

協調新客戶流失預測模型的端對端 ML 管線開發，協調資料工程師建構特徵管線、資料科學家進行模型實驗，以及 MLOps 工程師在 Kubernetes 上進行生產部署。

ML 平台工程師

設計並實作標準化的 MLOps 基礎設施，包括實驗追蹤、模型註冊、自動化重新訓練管線，以及為組織內多個 ML 團隊設定全面的監控。

新創公司技術長

從頭建構生產就緒的 ML 服務基礎設施，進行成本優化、自動擴展、藍綠部署和可觀測性，以支援新的推薦引擎功能。

試試這些提示

快速 ML 管線設計

為 [use case] 設計基本 ML 管線，包括資料擷取、模型訓練和 API 服務。專注於必要元件並提供高階架構圖。

特徵商店實作

使用 Feast 為 [domain] 設計特徵商店。包括資料來源連線、特徵定義、轉換邏輯、線上/離線商店配置，以及與訓練和服務管線的整合。

生產模型部署

為 Kubernetes 上的 [model type] 模型建立完整部署策略。包括 KServe 配置、HPA 自動擴展規則、Istio 流量管理進行金絲雀發布、監控指標和回滾程序。

完整 MLOps 平台

為 [organization size] 架構企業級 MLOps 平台。涵蓋使用 MLflow 的多團隊實驗追蹤、集中式特徵商店、具審批工作流程的模型註冊、自動化重新訓練觸發、漂移偵測和團隊成本分配。

最佳實務

使用 Git 和 DVC 對所有管線成果物進行版本控制，包括資料結構描述、模型配置和基礎設施程式碼，以確保可重現性
在每個管線階段實作全面的驗證閘道：資料品質檢查、模型效能閾值，以及升級前的基礎設施健康檢查
從一開始就設計可觀測性，採用結構化日誌、分散式追蹤和業務指標關聯，以實現快速事件回應

避免

訓練與服務偏差：在訓練和生產中使用不同的特徵計算邏輯，導致模型效能意外下降
手動模型部署：依賴手動流程進行模型升級，而非使用驗證閾道的自動化 CI/CD 管線
監控盲點：僅追蹤系統指標，而未監控資料漂移、概念漂移或業務 KPI 關聯

常見問題

此技能支援哪些雲端供應商用於 ML 管線部署？

此技能提供 AWS、Azure、GCP 和多雲部署的指導。配置範例包括可適配任何主要雲端供應商的 Terraform 模組和 Helm charts。

此技能產生可執行程式碼還是僅提供文件？

此技能提供詳細的 AI 代理程式提示範本，能產生實作程式碼、配置文件和基礎設施即程式碼。輸出包含關鍵元件的生產級程式碼片段。

多元代理程式編排如何運作？

此技能以分階段方式協調專業代理程式（data-engineer、data-scientist、ml-engineer、mlops-engineer 等），每個代理程式的輸出成為後續階段的輸入，確保每個步驟都有領域專業知識。

涵蓋哪些 ML 框架和工具？

此技能涵蓋熱門工具，包括 MLflow、Weights & Biases、Feast、Tecton、KServe、Seldon、Kubeflow、Airflow、FastAPI，以及標準 ML 框架如 PyTorch、TensorFlow 和 scikit-learn。

此技能是否能協助模型監控和漂移偵測？

是的，observability-engineer 代理程式提供全面的監控設定，包括統計漂移偵測（KS 檢驗、PSI）、Prometheus 指標、Grafana 儀表板，以及與 PagerDuty 整合的自動化警報。

這適合小型團隊還是僅適合企業？

此技能可從簡單的單一模型部署擴展到企業平台。您可以根據團隊規模和需求實作個別階段或元件，從基本的實驗追蹤開始，逐步發展到完整的編排。

開發者詳情

作者

sickn33

授權

MIT

儲存庫

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/machine-learning-ops-ml-pipeline

引用

main

檔案結構

📄 SKILL.md