ml-pipeline-workflow
엔드투엔드 오케스트레이션으로 프로덕션 ML 파이프라인 구축하기
머신러닝 팀은 데이터 준비, 학습, 검증, 배포를 신뢰할 수 있는 프로덕션 워크플로로 연결하는 데 어려움을 겪습니다. 이 스킬은 적절한 오케스트레이션, 모니터링, 배포 전략을 갖춘 엔드투엔드 MLOps 파이프라인 구축에 대한 포괄적인 가이드를 제공합니다.
스킬 ZIP 다운로드
Claude에서 업로드
설정 → 기능 → 스킬 → 스킬 업로드로 이동
토글을 켜고 사용 시작
테스트해 보기
"ml-pipeline-workflow" 사용 중입니다. Design a batch training pipeline for a recommendation model that retrains weekly
예상 결과:
프로덕션 데이터베이스에서 예약된 데이터 수집, 과거 사용자 상호작용을 사용한 피처 엔지니어링, GPU 클러스터에서의 분산 학습, 홀드아웃 테스트 세트에 대한 검증, 성능 임계값이 충족될 경우 서빙 인프라로의 자동 배포가 포함된 파이프라인 아키텍처입니다. MLflow 실험 추적 및 모델 레지스트리 통합이 포함됩니다.
"ml-pipeline-workflow" 사용 중입니다. How do I implement A/B testing for comparing two ML models in production?
예상 결과:
모델 버전 간 트래픽 분할, 두 모델에 대한 메트릭 수집, 통계적 유의성 테스트, 비즈니스 메트릭 기반 자동화된 승자 선택이 포함된 A/B 테스트 프레임워크입니다. 구현은 트래픽 라우팅을 위한 피처 플래그와 실시간 모니터링 대시보드를 사용합니다.
"ml-pipeline-workflow" 사용 중입니다. What monitoring should I set up for a production ML pipeline?
예상 결과:
입력 피처에 대한 데이터 드리프트 감지, 모델 성능 메트릭, 예측 지연 시간 및 처리량, 오류율 및 실패 모드, 리소스 활용도, 데이터 품질 검사를 포함한 포괄적인 모니터링 전략입니다. 임계값 위반에 대한 알림이 구성된 자동화된 롤백 기능이 있습니다.
보안 감사
안전This skill contains only documentation and guidance for ML pipeline workflows with no executable code. All static findings are false positives from pattern matching on markdown file extensions and documentation examples. The skill provides templates and best practices for MLOps workflows with no security concerns.
품질 점수
만들 수 있는 것
처음부터 새 ML 파이프라인 구축
데이터 수집, 학습, 검증, 배포 단계를 갖춘 새로운 머신러닝 프로젝트에 대한 완전한 MLOps 파이프라인을 설계하고 구현합니다.
레거시 ML 워크플로 현대화
기존 수동이거나 분산된 ML 프로세스를 자동화된 오케스트레이션 파이프라인으로 리팩터링하여 적절한 버전 관리와 모니터링을 제공합니다.
프로덕션 배포 전략 구현
카나리 배포, A/B 테스트, 프로덕션 ML 시스템에 대한 자동화된 롤백이 포함된 안전한 모델 배포 워크플로를 설정합니다.
이 프롬프트를 사용해 보세요
Help me design a simple ML pipeline for a classification model that includes data validation, training, and deployment stages. The pipeline should run on Airflow.
Create a data preparation pipeline that validates input data quality, engineers features, and versions datasets for reproducibility. Include Great Expectations for validation.
Design a model validation workflow that compares new models against baselines, runs performance tests, and generates approval reports before deployment.
Implement a canary deployment workflow for ML models with gradual traffic rollout, automated performance monitoring, and rollback triggers if metrics degrade.
모범 사례
- 독립적으로 테스트할 수 있고 재실행 시 부작용 없이 안전한 멱등성을 구현하는 모듈식 단계로 파이프라인을 설계합니다.
- DVC, MLflow 또는 사용자 정의 버전 관리 도구를 사용하여 데이터셋, 피처 변환, 모델 코드, 학습된 모델을 포함한 모든 아티팩트를 버전 관리합니다.
- 새로 시작하여 점진적으로 카나리 배포로 진행하는 롤아웃 전략을 구현하고, 프로덕션 모델에 대한 자동화된 롤백 기능을 유지합니다.
피하기
- 파이프라인 단계를 긴밀하게 결합하거나 의존성을 하드코딩하여 구성 요소를 격리하여 테스트하거나 워크플로를 수정하기 어렵게 만드는 것을 피합니다.
- 검증 단계를 건너뛰거나 적절한 테스트, 기준선과의 비교, 승인 워크플로 없이 모델을 직접 프로덕션에 배포하지 않습니다.
- 프로덕션 모델에 대한 모니터링과 알림을 무시하지 마세요. 이렇게 하면 성능 저하, 데이터 드리프트, 모델 실패가 감지되지 않습니다.