المهارات ML Engineer
📦

ML Engineer

آمن

Construa Sistemas de ML de Produção com Orientação Especializada

Implantar modelos de machine learning em produção requer expertise em serving, monitoramento e infraestrutura que muitas equipes não possuem. Esta skill fornece padrões testados em batalha para construir sistemas de ML confiáveis e escaláveis usando frameworks modernos como PyTorch 2.x e TensorFlow.

يدعم: Claude Codex Code(CC)
🥉 72 برونزي
1

تنزيل ZIP المهارة

2

رفع في Claude

اذهب إلى Settings → Capabilities → Skills → Upload skill

3

فعّل وابدأ الاستخدام

اختبرها

استخدام "ML Engineer". Projete uma arquitetura de serving de modelo para classificação de imagens com SLA de latência de 50ms

النتيجة المتوقعة:

  • Arquitetura recomendada usando TorchServe com instâncias GPU
  • Configuração de request batching para otimização de throughput
  • Camada Redis para caching de predições em entradas repetidas
  • Política de auto-scaling baseada em métricas de profundidade de fila e latência
  • Padrão circuit breaker para degradação graciosa durante falhas

استخدام "ML Engineer". Como implementar A/B testing para comparação de modelos

النتيجة المتوقعة:

  • Estratégia de divisão de tráfego com sessões sticky para consistência do usuário
  • Cálculo de poder estatístico para detectar melhoria de 2%
  • Métricas guardrail para monitorar efeitos colaterais negativos
  • Abordagem de teste sequencial com critérios de parada antecipada
  • Estimativa de tamanho de amostra baseada na taxa de conversão baseline

التدقيق الأمني

آمن
v1 • 2/25/2026

Prompt-only skill with no executable code. Static analysis found 0 files with executable content and computed risk score of 0/100. The SKILL.md file contains only markdown documentation and AI assistant instructions for ML engineering tasks. No security concerns identified.

0
الملفات التي تم فحصها
0
الأسطر التي تم تحليلها
0
النتائج
1
إجمالي عمليات التدقيق
لا توجد مشكلات أمنية
تم تدقيقه بواسطة: claude

درجة الجودة

38
الهندسة المعمارية
100
قابلية الصيانة
87
المحتوى
50
المجتمع
100
الأمان
74
الامتثال للمواصفات

ماذا يمكنك بناءه

Sistema de Recomendação em Tempo Real

Projete um motor de recomendação de alta capacidade processando 100K previsões por segundo com caching Redis e serving de modelo via TorchServe.

Automação de Pipeline de ML

Construa pipelines de ML end-to-end com Apache Airflow ou Kubeflow que automatizam processamento de dados, treinamento, validação e implantação.

Monitoramento de Desempenho do Modelo

Implemente monitoramento abrangente com Prometheus e Grafana para rastrear data drift, latência de predição e métricas de negócio em produção.

جرّب هذه الموجهات

Iniciante: Fundamentos de Implantação de Modelo de ML
Tenho um modelo PyTorch treinado salvo como model.pth. Guiame através da implantação como uma REST API usando FastAPI e Docker. Inclua health checks, validação de entrada e logging básico.
Intermediário: Design de Feature Store
Projete uma arquitetura de feature store para nosso sistema de recomendação de e-commerce. Precisamos de features em batch (histórico de compras do usuário) e features em tempo real (atividade da sessão). Compare Feast vs Tecton para nosso caso de uso.
Avançado: Estratégia de Treinamento Distribuído
Precisamos treinar um modelo transformer de 2B parâmetros em 8xA100 GPUs. Recomende uma estratégia de treinamento distribuído usando PyTorch FSDP ou DeepSpeed. Inclua gradient checkpointing, mixed precision e otimização de comunicação.
Especialista: Monitoramento de ML em Produção
Projete um sistema de monitoramento abrangente para nosso modelo de detecção de fraude processando 10K requisições/segundo. Inclua detecção de data drift, rastreamento de desempenho do modelo, thresholds de alerta e gatilhos de rollback automatizado.

أفضل الممارسات

  • Sempre implemente validação abrangente de entrada e verificações de qualidade de dados antes da inferência do modelo para detectar drift precocemente
  • Use infraestrutura como código (Terraform, CloudFormation) para implantações reproduzíveis de infraestrutura de ML
  • Projete para degradação graciosa com modelos de fallback e circuit breakers para manter o serviço durante falhas

تجنب

  • Implantar modelos sem monitoramento para data drift ou degradação de desempenho leva a falhas silenciosas
  • Hardcodar caminhos de modelo ou hiperparâmetros no código da aplicação em vez de usar model registries
  • Executar treinamento e inferência na mesma infraestrutura causa contenção de recursos e latência imprevisível

الأسئلة المتكررة

Quais frameworks de ML esta skill suporta?
Suporte primário para PyTorch 2.x e TensorFlow 2.x. Também cobre JAX/Flax para workloads de pesquisa, scikit-learn e bibliotecas de gradient boosting para ML clássico, e Hugging Face Transformers para aplicações LLM.
Esta skill pode ajudar com serviços de ML específicos de cloud?
Sim. Fornece orientação para AWS SageMaker, Azure ML, GCP Vertex AI e Databricks ML. Inclui templates de infraestrutura como código e melhores práticas para cada plataforma.
Esta skill ajuda com otimização de modelo para implantação edge?
Sim. Cobre TensorFlow Lite, PyTorch Mobile e ONNX Runtime para dispositivos edge. Inclui técnicas de quantização, pruning e distillation para ambientes com recursos limitados.
Quais ferramentas de monitoramento são recomendadas para ML em produção?
Recomenda Prometheus e Grafana para métricas de infraestrutura, Evidently AI ou WhyLabs para monitoramento específico de ML, e dashboards personalizados de métricas de negócio. Inclui orientação de configuração de alertas.
Como esta skill lida com versionamento e rollback de modelo?
Cobre MLflow Model Registry, DVC e Git LFS para versionamento. Fornece estratégias para blue-green deployments, canary releases e rollback automatizado baseado em thresholds de desempenho.
Esta skill pode ajudar com configuração de treinamento distribuído?
Sim. Fornece configurações para PyTorch DDP, FSDP, Horovod e DeepSpeed. Cobre setup multi-node, gradient accumulation, treinamento mixed precision e otimização de comunicação.

تفاصيل المطور

المؤلف

sickn33

الترخيص

MIT

مرجع

main

بنية الملفات

📄 SKILL.md