📦

ML Engineer

Name: ML Engineer
Author: sickn33

Seguro

Construa Sistemas de ML de Produção com Orientação Especializada

Implantar modelos de machine learning em produção requer expertise em serving, monitoramento e infraestrutura que muitas equipes não possuem. Esta skill fornece padrões testados em batalha para construir sistemas de ML confiáveis e escaláveis usando frameworks modernos como PyTorch 2.x e TensorFlow.

Suporta: Claude Codex Code(CC)

⚠️ 68 Ruim

Baixar o ZIP da skill

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

Ative e comece a usar

Testar

A utilizar "ML Engineer". Projete uma arquitetura de serving de modelo para classificação de imagens com SLA de latência de 50ms

Resultado esperado:

Arquitetura recomendada usando TorchServe com instâncias GPU
Configuração de request batching para otimização de throughput
Camada Redis para caching de predições em entradas repetidas
Política de auto-scaling baseada em métricas de profundidade de fila e latência
Padrão circuit breaker para degradação graciosa durante falhas

A utilizar "ML Engineer". Como implementar A/B testing para comparação de modelos

Resultado esperado:

Estratégia de divisão de tráfego com sessões sticky para consistência do usuário
Cálculo de poder estatístico para detectar melhoria de 2%
Métricas guardrail para monitorar efeitos colaterais negativos
Abordagem de teste sequencial com critérios de parada antecipada
Estimativa de tamanho de amostra baseada na taxa de conversão baseline

Auditoria de Segurança

Seguro

v1 • 2/25/2026

Prompt-only skill with no executable code. Static analysis found 0 files with executable content and computed risk score of 0/100. The SKILL.md file contains only markdown documentation and AI assistant instructions for ML engineering tasks. No security concerns identified.

Arquivos analisados

Linhas analisadas

achados

Total de auditorias

Nenhum problema de segurança encontrado

Auditado por: claude

Pontuação de qualidade

Arquitetura

100

Manutenibilidade

Conteúdo

Comunidade

100

Segurança

Conformidade com especificações

O Que Você Pode Construir

Sistema de Recomendação em Tempo Real

Projete um motor de recomendação de alta capacidade processando 100K previsões por segundo com caching Redis e serving de modelo via TorchServe.

Automação de Pipeline de ML

Construa pipelines de ML end-to-end com Apache Airflow ou Kubeflow que automatizam processamento de dados, treinamento, validação e implantação.

Monitoramento de Desempenho do Modelo

Implemente monitoramento abrangente com Prometheus e Grafana para rastrear data drift, latência de predição e métricas de negócio em produção.

Tente Estes Prompts

Iniciante: Fundamentos de Implantação de Modelo de ML

Tenho um modelo PyTorch treinado salvo como model.pth. Guiame através da implantação como uma REST API usando FastAPI e Docker. Inclua health checks, validação de entrada e logging básico.

Intermediário: Design de Feature Store

Projete uma arquitetura de feature store para nosso sistema de recomendação de e-commerce. Precisamos de features em batch (histórico de compras do usuário) e features em tempo real (atividade da sessão). Compare Feast vs Tecton para nosso caso de uso.

Avançado: Estratégia de Treinamento Distribuído

Precisamos treinar um modelo transformer de 2B parâmetros em 8xA100 GPUs. Recomende uma estratégia de treinamento distribuído usando PyTorch FSDP ou DeepSpeed. Inclua gradient checkpointing, mixed precision e otimização de comunicação.

Especialista: Monitoramento de ML em Produção

Projete um sistema de monitoramento abrangente para nosso modelo de detecção de fraude processando 10K requisições/segundo. Inclua detecção de data drift, rastreamento de desempenho do modelo, thresholds de alerta e gatilhos de rollback automatizado.

Melhores Práticas

Sempre implemente validação abrangente de entrada e verificações de qualidade de dados antes da inferência do modelo para detectar drift precocemente
Use infraestrutura como código (Terraform, CloudFormation) para implantações reproduzíveis de infraestrutura de ML
Projete para degradação graciosa com modelos de fallback e circuit breakers para manter o serviço durante falhas

Evitar

Implantar modelos sem monitoramento para data drift ou degradação de desempenho leva a falhas silenciosas
Hardcodar caminhos de modelo ou hiperparâmetros no código da aplicação em vez de usar model registries
Executar treinamento e inferência na mesma infraestrutura causa contenção de recursos e latência imprevisível

Perguntas Frequentes

Quais frameworks de ML esta skill suporta?

Suporte primário para PyTorch 2.x e TensorFlow 2.x. Também cobre JAX/Flax para workloads de pesquisa, scikit-learn e bibliotecas de gradient boosting para ML clássico, e Hugging Face Transformers para aplicações LLM.

Esta skill pode ajudar com serviços de ML específicos de cloud?

Sim. Fornece orientação para AWS SageMaker, Azure ML, GCP Vertex AI e Databricks ML. Inclui templates de infraestrutura como código e melhores práticas para cada plataforma.

Esta skill ajuda com otimização de modelo para implantação edge?

Sim. Cobre TensorFlow Lite, PyTorch Mobile e ONNX Runtime para dispositivos edge. Inclui técnicas de quantização, pruning e distillation para ambientes com recursos limitados.

Quais ferramentas de monitoramento são recomendadas para ML em produção?

Recomenda Prometheus e Grafana para métricas de infraestrutura, Evidently AI ou WhyLabs para monitoramento específico de ML, e dashboards personalizados de métricas de negócio. Inclui orientação de configuração de alertas.

Como esta skill lida com versionamento e rollback de modelo?

Cobre MLflow Model Registry, DVC e Git LFS para versionamento. Fornece estratégias para blue-green deployments, canary releases e rollback automatizado baseado em thresholds de desempenho.

Esta skill pode ajudar com configuração de treinamento distribuído?

Sim. Fornece configurações para PyTorch DDP, FSDP, Horovod e DeepSpeed. Cobre setup multi-node, gradient accumulation, treinamento mixed precision e otimização de comunicação.

Detalhes do Desenvolvedor

Autor

sickn33

Licença

MIT

Repositório

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/ml-engineer

Referência

main

Estrutura de arquivos

📄 SKILL.md