airunway-aks-setup
在 AKS 上從空白叢集設定 AI Runway 到模型執行
在 Azure Kubernetes Service 上部署 LLM 需要協調多個元件,包括 GPU 節點、推論提供者以及模型構件。本技能將引導您完成從叢集驗證到首個模型部署運作的全部設定流程。
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「airunway-aks-setup」。 在我的 AKS 叢集上設定 AI Runway
預期結果:
步驟 1 - 叢集驗證:
✓ kubectl 已找到
✓ make 已找到
✓ curl 已找到
✓ 叢集內容:my-cluster
✓ 節點:3 個總計,偵測到 1 個 GPU 節點
- GPU 節點:Standard_A100_80GB
- VRAM:80 GB
- bfloat16:支援
是否準備好繼續至步驟 2?
正在使用「airunway-aks-setup」。 在我的叢集上部署具有 8B 參數的模型
預期結果:
建議:meta-llama/Llama-3.1-8B-Instruct
提供者:KAITO (vLLM)
原因:您的 A100-80GB 有容量可執行 8B 模型並具有張量平行選項。
這是需要 HuggingFace 存取權杖的閘道模型。是否繼續收集權杖?
安全審計
低風險This is a legitimate Microsoft-published documentation skill for AI Runway AKS setup. Static scanner flagged documentation files containing bash/PowerShell code examples as potential security issues. After evaluation, all findings are false positives: the skill provides markdown documentation with command examples for human execution, not executable code. No actual command injection, path traversal vulnerabilities, or malicious patterns exist. The skill is safe for publication with low risk level.
低風險問題 (1)
品質評分
你能建構什麼
首次 AI Runway 部署
初次接觸 AKS 上的 AI Runway。從叢集驗證開始,完整引導您完成首次使用 GPU 加速的模型部署。
GPU 功能評估
探索可用的 GPU 硬體、檢查 dtype 支援(bfloat16、float16),並根據叢集 VRAM 容量提供模型建議。
疑難排解失敗的部署
在部分設定後從特定步驟繼續,或執行回滾程序以復原失敗的部署並重新開始。
試試這些提示
在我的 AKS 叢集上設定 AI Runway。我有現有的叢集配備 GPU 節點。
跳至步驟 4 並在我的 AKS 叢集上設定 KAITO 推論提供者。
檢查我的 AKS 叢集中有哪些可用的 GPU,並告訴我可以執行哪些模型。
使用 AI Runway 將 Llama-3.1-8B 模型部署至我的 AKS 叢集。我有 A100-80GB 節點。
最佳實務
- 在選擇模型大小前,始終確認 GPU 節點可用性與 VRAM 容量
- 先使用非閘道模型(如 Phi-3 或 Gemma)驗證設定,再使用閘道模型
- 使用跳至步驟參數在中斷後從特定步驟繼續
避免
- 在確認您了解 Azure 上的 GPU 運算成本之前,請勿執行此技能
- 請勿跳過叢集驗證——了解您的 GPU 硬體是模型選擇的必要條件
- 在非閘道模型驗證設定完成之前,請勿嘗試閘道模型(Llama 等)