airunway-aks-setup
Настройка AI Runway на AKS: от пустого кластера до работающей модели
Развёртывание LLM в Azure Kubernetes Service требует оркестрации нескольких компонентов, включая GPU-узлы, провайдеры инференса и артефакты моделей. Этот навык проведёт вас через полный процесс настройки — от проверки кластера до первого успешного развёртывания модели.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "airunway-aks-setup". Set up AI Runway on my AKS cluster
Erwartetes Ergebnis:
Шаг 1 - Проверка кластера:
✓ kubectl найден
✓ make найден
✓ curl найден
✓ Контекст кластера: my-cluster
✓ Узлы: 3 всего, обнаружен 1 GPU-узел
- GPU-узел: Standard_A100_80GB
- VRAM: 80 GB
- bfloat16: Поддерживается
Готовы перейти к шагу 2?
Verwendung von "airunway-aks-setup". Deploy a model with 8B parameters on my cluster
Erwartetes Ergebnis:
Рекомендация: meta-llama/Llama-3.1-8B-Instruct
Провайдер: KAITO (vLLM)
Причина: Ваш A100-80GB имеет ёмкость для 8B-моделей с опциями тензорного параллелизма.
Это gated-модель, требующая HuggingFace access token. Продолжить с сбором токена?
Sicherheitsaudit
Niedriges RisikoThis is a legitimate Microsoft-published documentation skill for AI Runway AKS setup. Static scanner flagged documentation files containing bash/PowerShell code examples as potential security issues. After evaluation, all findings are false positives: the skill provides markdown documentation with command examples for human execution, not executable code. No actual command injection, path traversal vulnerabilities, or malicious patterns exist. The skill is safe for publication with low risk level.
Probleme mit niedrigem Risiko (1)
Qualitätsbewertung
Was du bauen kannst
Первое развёртывание AI Runway
Вы впервые работаете с AI Runway на AKS. Полное пошаговое руководство от проверки кластера до первого работающего развёртывания модели с GPU-ускорением.
Оценка GPU-возможностей
Обнаружение доступного GPU-оборудования, проверка поддержки dtype (bfloat16, float16) и получение рекомендаций по моделям на основе объёма VRAM вашего кластера.
Устранение неудачных развёртываний
Продолжение с определённого шага после частичной настройки или выполнение процедур отката для отмены неудачного развёртывания и начала с чистого листа.
Probiere diese Prompts
Set up AI Runway on my AKS cluster. I have an existing cluster with GPU nodes.
Skip to step 4 and set up the KAITO inference provider on my AKS cluster.
Check what GPUs are available in my AKS cluster and tell me which models I can run.
Deploy the Llama-3.1-8B model to my AKS cluster using AI Runway. I have an A100-80GB node.
Bewährte Verfahren
- Всегда подтверждайте доступность GPU-узлов и объём VRAM перед выбором размера модели
- Начните с не-gated моделей, таких как Phi-3 или Gemma, чтобы проверить настройку перед использованием gated-моделей
- Используйте параметр skip-to-step для продолжения с определённых шагов после прерываний
Vermeiden
- Не запускайте этот навык без предварительного подтверждения, что вы понимаете стоимость GPU-вычислений в Azure
- Не пропускайте проверку кластера — понимание вашего GPU-оборудования необходимо для выбора модели
- Не пытайтесь использовать gated-модели (Llama и др.), пока не проверили настройку с не-gated моделью