ML Engineer
Construa Sistemas de ML de Produção com Orientação Especializada
Implantar modelos de machine learning em produção requer expertise em serving, monitoramento e infraestrutura que muitas equipes não possuem. Esta skill fornece padrões testados em batalha para construir sistemas de ML confiáveis e escaláveis usando frameworks modernos como PyTorch 2.x e TensorFlow.
تنزيل ZIP المهارة
رفع في Claude
اذهب إلى Settings → Capabilities → Skills → Upload skill
فعّل وابدأ الاستخدام
اختبرها
استخدام "ML Engineer". Projete uma arquitetura de serving de modelo para classificação de imagens com SLA de latência de 50ms
النتيجة المتوقعة:
- Arquitetura recomendada usando TorchServe com instâncias GPU
- Configuração de request batching para otimização de throughput
- Camada Redis para caching de predições em entradas repetidas
- Política de auto-scaling baseada em métricas de profundidade de fila e latência
- Padrão circuit breaker para degradação graciosa durante falhas
استخدام "ML Engineer". Como implementar A/B testing para comparação de modelos
النتيجة المتوقعة:
- Estratégia de divisão de tráfego com sessões sticky para consistência do usuário
- Cálculo de poder estatístico para detectar melhoria de 2%
- Métricas guardrail para monitorar efeitos colaterais negativos
- Abordagem de teste sequencial com critérios de parada antecipada
- Estimativa de tamanho de amostra baseada na taxa de conversão baseline
التدقيق الأمني
آمنPrompt-only skill with no executable code. Static analysis found 0 files with executable content and computed risk score of 0/100. The SKILL.md file contains only markdown documentation and AI assistant instructions for ML engineering tasks. No security concerns identified.
درجة الجودة
ماذا يمكنك بناءه
Sistema de Recomendação em Tempo Real
Projete um motor de recomendação de alta capacidade processando 100K previsões por segundo com caching Redis e serving de modelo via TorchServe.
Automação de Pipeline de ML
Construa pipelines de ML end-to-end com Apache Airflow ou Kubeflow que automatizam processamento de dados, treinamento, validação e implantação.
Monitoramento de Desempenho do Modelo
Implemente monitoramento abrangente com Prometheus e Grafana para rastrear data drift, latência de predição e métricas de negócio em produção.
جرّب هذه الموجهات
Tenho um modelo PyTorch treinado salvo como model.pth. Guiame através da implantação como uma REST API usando FastAPI e Docker. Inclua health checks, validação de entrada e logging básico.
Projete uma arquitetura de feature store para nosso sistema de recomendação de e-commerce. Precisamos de features em batch (histórico de compras do usuário) e features em tempo real (atividade da sessão). Compare Feast vs Tecton para nosso caso de uso.
Precisamos treinar um modelo transformer de 2B parâmetros em 8xA100 GPUs. Recomende uma estratégia de treinamento distribuído usando PyTorch FSDP ou DeepSpeed. Inclua gradient checkpointing, mixed precision e otimização de comunicação.
Projete um sistema de monitoramento abrangente para nosso modelo de detecção de fraude processando 10K requisições/segundo. Inclua detecção de data drift, rastreamento de desempenho do modelo, thresholds de alerta e gatilhos de rollback automatizado.
أفضل الممارسات
- Sempre implemente validação abrangente de entrada e verificações de qualidade de dados antes da inferência do modelo para detectar drift precocemente
- Use infraestrutura como código (Terraform, CloudFormation) para implantações reproduzíveis de infraestrutura de ML
- Projete para degradação graciosa com modelos de fallback e circuit breakers para manter o serviço durante falhas
تجنب
- Implantar modelos sem monitoramento para data drift ou degradação de desempenho leva a falhas silenciosas
- Hardcodar caminhos de modelo ou hiperparâmetros no código da aplicação em vez de usar model registries
- Executar treinamento e inferência na mesma infraestrutura causa contenção de recursos e latência imprevisível