技能 senior-ml-engineer
🤖

senior-ml-engineer

安全 🌐 网络访问⚙️ 外部命令

Развертывание ML-моделей в производственной среде

也可从以下获取: davila7

Создание ML-пайплайнов требует экспертизы в развертывании моделей, мониторинге и практиках MLOps. Этот навык предоставляет готовые к использованию в производстве инструменты для развертывания ML-моделей, интеграции LLM и создания масштабируемых RAG-систем с корпоративной надежностью.

支持: Claude Codex Code(CC)
🥈 77 白银
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“senior-ml-engineer”。 Помоги развернуть мою обученную TensorFlow модель для инференса в реальном времени с задержкой менее 50мс

预期结果:

  • Упаковка модели в контейнер с использованием Docker и TensorFlow Serving
  • Создание Kubernetes-развертывания с HPA для автоматического масштабирования
  • Реализация пакетного инференса для оптимизации пропускной способности
  • Добавление Prometheus-метрик для задержки, пропускной способности и частоты ошибок
  • Настройка балансировщика нагрузки с проверками работоспособности и автоматическими выключателями

正在使用“senior-ml-engineer”。 Создай RAG-систему для запросов к моей внутренней базе знаний с поддержкой цитирования

预期结果:

  • Настройка модели эмбеддингов и векторной базы данных (Pinecone или Weaviate)
  • Реализация чанкинга документов с перекрытием для сохранения контекста
  • Создание гибридного поиска, объединяющего семантическое и ключевое сопоставление
  • Добавление цитирования источников и оценки достоверности к ответам
  • Реализация переранжирования для повышения качества результатов

安全审计

安全
v3 • 1/16/2026

All 78 static findings evaluated as false positives. The static scanner incorrectly flagged documentation text (headings, bullet points) containing common English words as 'weak cryptographic algorithm' patterns. Python scripts contain only standard library imports and logging. Bash code blocks in SKILL.md are documentation examples, not shell execution. No malicious code exists in this skill.

9
已扫描文件
1,614
分析行数
2
发现项
3
审计总数
审计者: claude 查看审计历史 →

质量评分

68
架构
100
可维护性
87
内容
23
社区
100
安全
91
规范符合性

你能构建什么

Развертывание моделей в производственной среде

Упаковка и развертывание обученных ML-моделей с Docker, Kubernetes и REST API эндпоинтами

Создание RAG-приложений

Создание систем генерации с дополнением на основе поиска с использованием LlamaIndex и LangChain

Внедрение MLOps

Настройка версионирования моделей, мониторинга и автоматических пайплайнов переобучения с MLflow

试试这些提示

Развертывание модели
Помоги мне развернуть мою обученную модель классификации PyTorch в производственной среде. Мне нужен REST API эндпоинт, Docker-контейнер и конфигурация развертывания Kubernetes. Включи мониторинг задержки модели и дрейфа точности.
Создание RAG-системы
Создай RAG-систему для моей документации. У меня есть PDF и markdown файлы. Используй векторную базу данных, реализуй стратегии чанкинга и создай интерфейс запросов, который работает с моим внутренним LLM API.
Настройка MLOps
Настрой MLOps для моей команды машинного обучения. Нам нужен MLflow для версионирования моделей, автоматические пайплайны обучения, срабатывающие при изменении данных, и оповещения о деградации производительности модели.
Продвинутая интеграция LLM
Спроектируй архитектуру корпоративной интеграции LLM. Включи кэширование промптов, ограничение скорости, отслеживание затрат по командам и интеграцию с нашей существующей системой аутентификации. Поддержка как OpenAI, так и self-hosted моделей.

最佳实践

  • Проектируйте сразу с 10-кратным масштабом с архитектурой горизонтального масштабирования
  • Внедряйте комплексный мониторинг, включая обнаружение дрейфа и проверки качества данных
  • Используйте хранилища признаков для обеспечения согласованности между обучением и инференсом

避免

  • Развертывание моделей без контроля версий или возможности отката
  • Пропуск обнаружения дрейфа моделей до возникновения проблем в производственной среде
  • Жесткое задание API-ключей или учетных данных вместо использования управления секретами

常见问题

Какие ML-фреймворки поддерживает этот навык?
PyTorch, TensorFlow, Scikit-learn и XGBoost полностью поддерживаются с инструментами развертывания.
Могу ли я использовать это для тонкой настройки LLM?
Навык фокусируется на развертывании и интеграции. Для тонкой настройки используйте возможности codex от Claude.
Включает ли это облачные учетные данные?
Нет. Вы предоставляете собственные учетные данные AWS, GCP или Azure для развертывания.
Какие инструменты мониторинга интегрированы?
MLflow, Weights & Biases и Prometheus для метрик, а также пользовательские шаблоны дашбордов.
Могу ли я развернуть on-premises?
Да. Конфигурации Docker и Kubernetes работают на любом K8s-кластере или среде выполнения контейнеров.
Как обрабатывать обновления моделей?
Используйте флаги функций и канареечные развертывания для безопасных выпусков с возможностью быстрого отката.