技能 airunway-aks-setup

📦

airunway-aks-setup

Name: airunway-aks-setup
Author: microsoft

低風險

在 AKS 上從空白叢集設定 AI Runway 到模型執行

在 Azure Kubernetes Service 上部署 LLM 需要協調多個元件，包括 GPU 節點、推論提供者以及模型構件。本技能將引導您完成從叢集驗證到首個模型部署運作的全部設定流程。

支援: Claude Codex Code(CC)

🥉 72 青銅

下載技能 ZIP

在 Claude 中上傳

前往設定 → 功能 → 技能 → 上傳技能

開啟並開始使用

測試它

正在使用「airunway-aks-setup」。在我的 AKS 叢集上設定 AI Runway

預期結果:

步驟 1 - 叢集驗證：
✓ kubectl 已找到
✓ make 已找到
✓ curl 已找到
✓ 叢集內容：my-cluster
✓ 節點：3 個總計，偵測到 1 個 GPU 節點
- GPU 節點：Standard_A100_80GB
- VRAM：80 GB
- bfloat16：支援

是否準備好繼續至步驟 2？

正在使用「airunway-aks-setup」。在我的叢集上部署具有 8B 參數的模型

預期結果:

建議：meta-llama/Llama-3.1-8B-Instruct
提供者：KAITO (vLLM)
原因：您的 A100-80GB 有容量可執行 8B 模型並具有張量平行選項。

這是需要 HuggingFace 存取權杖的閘道模型。是否繼續收集權杖？

安全審計

低風險

v1 • 4/24/2026

This is a legitimate Microsoft-published documentation skill for AI Runway AKS setup. Static scanner flagged documentation files containing bash/PowerShell code examples as potential security issues. After evaluation, all findings are false positives: the skill provides markdown documentation with command examples for human execution, not executable code. No actual command injection, path traversal vulnerabilities, or malicious patterns exist. The skill is safe for publication with low risk level.

已掃描檔案

619

分析行數

發現項

審計總數

低風險問題 (1)

SKILL.md:13 SKILL.md:19 references/steps/step-1-verify.md:9-52 references/steps/step-5-deploy.md:3-96

Documentation Code Examples Misidentified as Shell Execution

Static scanner flagged markdown files with bash/PowerShell code blocks as 'Ruby/shell backtick execution'. These are documentation files providing command examples for users to execute manually. No actual shell execution occurs. Pattern matchers cannot distinguish between executable code and human-readable documentation.

審計者: claude

品質評分

架構

100

可維護性

內容

社群

安全

規範符合性

你能建構什麼

首次 AI Runway 部署

初次接觸 AKS 上的 AI Runway。從叢集驗證開始，完整引導您完成首次使用 GPU 加速的模型部署。

GPU 功能評估

探索可用的 GPU 硬體、檢查 dtype 支援（bfloat16、float16），並根據叢集 VRAM 容量提供模型建議。

疑難排解失敗的部署

在部分設定後從特定步驟繼續，或執行回滾程序以復原失敗的部署並重新開始。

試試這些提示

基本 AI Runway 設定

在我的 AKS 叢集上設定 AI Runway。我有現有的叢集配備 GPU 節點。

從特定步驟繼續

跳至步驟 4 並在我的 AKS 叢集上設定 KAITO 推論提供者。

僅限 GPU 評估

檢查我的 AKS 叢集中有哪些可用的 GPU，並告訴我可以執行哪些模型。

部署特定模型

使用 AI Runway 將 Llama-3.1-8B 模型部署至我的 AKS 叢集。我有 A100-80GB 節點。

最佳實務

在選擇模型大小前，始終確認 GPU 節點可用性與 VRAM 容量
先使用非閘道模型（如 Phi-3 或 Gemma）驗證設定，再使用閘道模型
使用跳至步驟參數在中斷後從特定步驟繼續

避免

在確認您了解 Azure 上的 GPU 運算成本之前，請勿執行此技能
請勿跳過叢集驗證——了解您的 GPU 硬體是模型選擇的必要條件
在非閘道模型驗證設定完成之前，請勿嘗試閘道模型（Llama 等）

常見問題

什麼是 AI Runway？

AI Runway 是一個 Kubernetes 原生架構，用於在 Azure Kubernetes Service 上部署和管理 LLM 推論。它提供模型部署的自訂資源定義，並與 KAITO、Dynamo 和 KubeRay 等推論提供者整合。

需要現有的 AKS 叢集嗎？

是的。本技能假設您有現有的 AKS 叢集。如果需要建立，請先使用 azure-kubernetes 技能佈建具有 GPU 節點的叢集，然後再返回本技能。

支援哪些 GPU？

AI Runway 支援 NVIDIA GPU，包括 T4、V100、A10、A10G、L4、L40S、A100、H100 和 H200。每種都有不同的 dtype 支援——較舊的 GPU 如 T4 和 V100 不支援 bfloat16。

為什麼我的部署因 bfloat16 錯誤而失敗？

T4 和 V100 GPU 不支援 bfloat16 精度。在服務引數中加入 --dtype float16，或切換至 xformers 注意後端。請參閱 gpu-profiles.md 參考文件以了解您的特定 GPU 限制。

模型部署需要多長時間？

小型模型（1B-8B）通常在 5-10 分鐘內部署完成。大型模型（70B+）可能需要 20-40 分鐘或更長時間，因為模型權重必須先從 HuggingFace 下載。請檢查 Pod 日誌以了解下載進度。

如何回滾失敗的部署？

使用 kubectl delete 刪除模型部署和密碼。對於提供者和控制器，請使用 AI Runway 儲存庫根目錄中的 make 命令。請參閱疑難排解.md 以了解完整的回滾順序。

開發者詳情

作者

microsoft

授權

MIT

儲存庫

https://github.com/microsoft/azure-skills/tree/main/.github/plugins/azure-skills/skills/airunway-aks-setup/

引用

main

檔案結構

📁 references/

📁 steps/

📄 step-1-verify.md

📄 step-2-controller.md

📄 step-3-gpu.md

📄 step-4-provider.md

📄 step-5-deploy.md

📄 step-6-summary.md

📄 gpu-profiles.md

📄 model-sizing.md

📄 powershell-notes.md

📄 troubleshooting.md

📄 SKILL.md