senior-ml-engineer
Развертывание ML-моделей в производственной среде
也可从以下获取: davila7
Создание ML-пайплайнов требует экспертизы в развертывании моделей, мониторинге и практиках MLOps. Этот навык предоставляет готовые к использованию в производстве инструменты для развертывания ML-моделей, интеграции LLM и создания масштабируемых RAG-систем с корпоративной надежностью.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“senior-ml-engineer”。 Помоги развернуть мою обученную TensorFlow модель для инференса в реальном времени с задержкой менее 50мс
预期结果:
- Упаковка модели в контейнер с использованием Docker и TensorFlow Serving
- Создание Kubernetes-развертывания с HPA для автоматического масштабирования
- Реализация пакетного инференса для оптимизации пропускной способности
- Добавление Prometheus-метрик для задержки, пропускной способности и частоты ошибок
- Настройка балансировщика нагрузки с проверками работоспособности и автоматическими выключателями
正在使用“senior-ml-engineer”。 Создай RAG-систему для запросов к моей внутренней базе знаний с поддержкой цитирования
预期结果:
- Настройка модели эмбеддингов и векторной базы данных (Pinecone или Weaviate)
- Реализация чанкинга документов с перекрытием для сохранения контекста
- Создание гибридного поиска, объединяющего семантическое и ключевое сопоставление
- Добавление цитирования источников и оценки достоверности к ответам
- Реализация переранжирования для повышения качества результатов
安全审计
安全All 78 static findings evaluated as false positives. The static scanner incorrectly flagged documentation text (headings, bullet points) containing common English words as 'weak cryptographic algorithm' patterns. Python scripts contain only standard library imports and logging. Bash code blocks in SKILL.md are documentation examples, not shell execution. No malicious code exists in this skill.
风险因素
质量评分
你能构建什么
Развертывание моделей в производственной среде
Упаковка и развертывание обученных ML-моделей с Docker, Kubernetes и REST API эндпоинтами
Создание RAG-приложений
Создание систем генерации с дополнением на основе поиска с использованием LlamaIndex и LangChain
Внедрение MLOps
Настройка версионирования моделей, мониторинга и автоматических пайплайнов переобучения с MLflow
试试这些提示
Помоги мне развернуть мою обученную модель классификации PyTorch в производственной среде. Мне нужен REST API эндпоинт, Docker-контейнер и конфигурация развертывания Kubernetes. Включи мониторинг задержки модели и дрейфа точности.
Создай RAG-систему для моей документации. У меня есть PDF и markdown файлы. Используй векторную базу данных, реализуй стратегии чанкинга и создай интерфейс запросов, который работает с моим внутренним LLM API.
Настрой MLOps для моей команды машинного обучения. Нам нужен MLflow для версионирования моделей, автоматические пайплайны обучения, срабатывающие при изменении данных, и оповещения о деградации производительности модели.
Спроектируй архитектуру корпоративной интеграции LLM. Включи кэширование промптов, ограничение скорости, отслеживание затрат по командам и интеграцию с нашей существующей системой аутентификации. Поддержка как OpenAI, так и self-hosted моделей.
最佳实践
- Проектируйте сразу с 10-кратным масштабом с архитектурой горизонтального масштабирования
- Внедряйте комплексный мониторинг, включая обнаружение дрейфа и проверки качества данных
- Используйте хранилища признаков для обеспечения согласованности между обучением и инференсом
避免
- Развертывание моделей без контроля версий или возможности отката
- Пропуск обнаружения дрейфа моделей до возникновения проблем в производственной среде
- Жесткое задание API-ключей или учетных данных вместо использования управления секретами
常见问题
Какие ML-фреймворки поддерживает этот навык?
Могу ли я использовать это для тонкой настройки LLM?
Включает ли это облачные учетные данные?
Какие инструменты мониторинга интегрированы?
Могу ли я развернуть on-premises?
Как обрабатывать обновления моделей?
开发者详情
许可证
MIT
引用
main