Compétences ml-pipeline-workflow
📦

ml-pipeline-workflow

Sûr

Создание производственных ML-пайплайнов со сквозной оркестрацией

Команды машинного обучения испытывают трудности с объединением подготовки данных, обучения, валидации и развёртывания в надёжные рабочие процессы для продакшена. Этот навык предоставляет комплексное руководство по созданию сквозных MLOps-пайплайнов с правильной оркестрацией, мониторингом и стратегиями развёртывания.

Prend en charge: Claude Codex Code(CC)
📊 71 Adéquat
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "ml-pipeline-workflow". Design a batch training pipeline for a recommendation model that retrains weekly

Résultat attendu:

Архитектура пайплайна с запланированным извлечением данных из продакшен-базы данных, конструированием признаков на основе исторических пользовательских взаимодействий, распределённым обучением на GPU-кластере, валидацией на отложенном тестовом наборе и автоматическим развёртыванием в инфраструктуру обслуживания, если пороги производительности достигнуты. Включает отслеживание экспериментов MLflow и интеграцию с реестром моделей.

Utilisation de "ml-pipeline-workflow". How do I implement A/B testing for comparing two ML models in production?

Résultat attendu:

Фреймворк A/B-тестирования с распределением трафика между версиями моделей, сбором метрик для обеих моделей, проверкой статистической значимости и автоматическим выбором победителя на основе бизнес-метрик. Реализация использует feature flags для маршрутизации трафика и дашборды реального времени для мониторинга.

Utilisation de "ml-pipeline-workflow". What monitoring should I set up for a production ML pipeline?

Résultat attendu:

Комплексная стратегия мониторинга, включающая обнаружение дрейфа данных для входных признаков, метрики производительности модели, задержку и пропускную способность предсказаний, частоту ошибок и режимы отказов, использование ресурсов и проверки качества данных. Настроены оповещения при нарушении порогов с возможностью автоматического отката.

Audit de sécurité

Sûr
v5 • 1/21/2026

This skill contains only documentation and guidance for ML pipeline workflows with no executable code. All static findings are false positives from pattern matching on markdown file extensions and documentation examples. The skill provides templates and best practices for MLOps workflows with no security concerns.

2
Fichiers analysés
557
Lignes analysées
0
résultats
5
Total des audits
Aucun problème de sécurité trouvé

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
29
Communauté
100
Sécurité
91
Conformité aux spécifications

Ce que vous pouvez construire

Создание нового ML-пайплайна с нуля

Проектирование и реализация полного MLOps-пайплайна для нового проекта машинного обучения с этапами загрузки данных, обучения, валидации и развёртывания.

Модернизация устаревших ML-рабочих процессов

Рефакторинг существующих ручных или фрагментированных ML-процессов в автоматизированные, оркестрируемые пайплайны с правильным версионированием и мониторингом.

Реализация стратегии развёртывания для продакшена

Настройка безопасных рабочих процессов развёртывания моделей с канареечными релизами, A/B-тестированием и автоматическим откатом для продакшен ML-систем.

Essayez ces prompts

Базовая архитектура пайплайна
Помогите спроектировать простой ML-пайплайн для модели классификации, который включает этапы валидации данных, обучения и развёртывания. Пайплайн должен работать на Airflow.
Рабочий процесс подготовки данных
Создайте пайплайн подготовки данных, который проверяет качество входных данных, конструирует признаки и версионирует наборы данных для воспроизводимости. Включите Great Expectations для валидации.
Фреймворк валидации модели
Спроектируйте рабочий процесс валидации модели, который сравнивает новые модели с базовыми показателями, запускает тесты производительности и генерирует отчёты об одобрении перед развёртыванием.
Стратегия развёртывания для продакшена
Реализуйте рабочий процесс канареечного развёртывания ML-моделей с постепенным переносом трафика, автоматическим мониторингом производительности и триггерами отката, если метрики деградируют.

Bonnes pratiques

  • Проектируйте пайплайны с модульными этапами, которые можно тестировать независимо, и реализуйте идемпотентность, чтобы повторный запуск этапов был безопасен без побочных эффектов.
  • Версионируйте все артефакты, включая наборы данных, трансформации признаков, код моделей и обученные модели, используя такие инструменты, как DVC, MLflow или пользовательские системы версионирования.
  • Реализуйте стратегии постепенного внедрения, начиная с теневых развёртываний, переходя к канареечным релизам и сохраняя возможности автоматического отката для продакшен-моделей.

Éviter

  • Избегайте тесной связности этапов пайплайна или жёстко закодированных зависимостей, которые затрудняют тестирование компонентов изолированно или модификацию рабочего процесса.
  • Не пропускайте этапы валидации и не развёртывайте модели напрямую в продакшен без надлежащего тестирования, сравнения с базовыми показателями и рабочих процессов одобрения.
  • Никогда не игнорируйте мониторинг и оповещения для продакшен-моделей, так как это приводит к необнаруженной деградации производительности, дрейфу данных и отказам моделей.

Foire aux questions

Какой инструмент оркестрации использовать для ML-пайплайнов?
Выбор зависит от вашей инфраструктуры и предпочтений команды. Apache Airflow широко используется и имеет сильную поддержку сообщества. Dagster предлагает современную оркестрацию на основе ассетов. Kubeflow Pipelines идеально подходит для Kubernetes-сред. Prefect предоставляет удобный для разработчиков Python-ориентированный подход. Начните с того, что ваша команда уже использует для рабочих процессов с данными.
Как обрабатывать версионирование моделей и откат?
Используйте реестр моделей, такой как MLflow или реестры облачных платформ, для версионирования моделей с метаданными. Реализуйте стратегии развёртывания blue-green или канареечные, которые сохраняют предыдущие версии моделей работающими. Настройте автоматические проверки работоспособности и триггеры отката на основе метрик производительности. Сохраняйте артефакты и конфигурации для каждой версии для быстрого отката.
В чём разница между пакетными и потоковыми ML-пайплайнами?
Пакетные пайплайны обрабатывают данные и делают предсказания по расписанию с более высокой задержкой, но лучшей эффективностью использования ресурсов. Потоковые пайплайны обслуживают предсказания с низкой задержкой для отдельных запросов, но требуют больше инфраструктуры. Многие продакшен-системы используют гибридные подходы с потоковым обслуживанием, поддерживаемые пакетным конструированием признаков и обновлением моделей.
Как реализовать валидацию данных в ML-пайплайнах?
Используйте библиотеки, такие как Great Expectations или TensorFlow Data Validation, для определения схем данных и проверок качества. Валидируйте типы данных, диапазоны значений, распределения и связи на границах пайплайна. Быстро завершайте работу при сбое валидации, а не распространяйте плохие данные. Логируйте результаты валидации для отладки и мониторинга качества данных со временем.
Какие метрики отслеживать для здоровья ML-пайплайна?
Отслеживайте время выполнения пайплайна и показатели успешности для каждого этапа. Мониторьте объёмы данных и распределения признаков для обнаружения дрейфа. Логируйте метрики производительности модели, включая точность, полноту и F1-меру. Измеряйте задержку и пропускную способность предсказаний для обслуживания. Настраивайте оповещения об аномалиях и нарушениях порогов.
Как тестировать ML-пайплайны перед развёртыванием в продакшен?
Тестируйте отдельные компоненты пайплайна с помощью юнит-тестов с использованием примерных данных. Запускайте интеграционные тесты на всём пайплайне с реалистичными наборами данных. Выполняйте канареечные развёртывания с небольшими процентами трафика для проверки поведения в продакшене. Используйте теневые развёртывания для сравнения новых пайплайнов с существующими без влияния на пользователей. Проверяйте, что процедуры отката работают корректно.

Détails du développeur

Structure de fichiers

📄 SKILL.md