技能 azure-ai-voicelive-py

🎙️

azure-ai-voicelive-py

Name: azure-ai-voicelive-py
Author: sickn33

安全

使用 Azure 建構即時語音 AI 應用程式

使用 Azure AI Voice Live SDK 建立具有即時雙向音訊串流功能的互動式語音 AI 應用程式。此技能提供建構生產級語音助理的完整參考文件。

支援: Claude Codex Code(CC)

📊 71 充足

下載技能 ZIP

在 Claude 中上傳

前往設定 → 功能 → 技能 → 上傳技能

開啟並開始使用

測試它

正在使用「azure-ai-voicelive-py」。如何使用 DefaultAzureCredential 向 Azure Voice Live 進行驗證？

預期結果:

使用 DefaultAzureCredential 進行生產環境驗證：```python
from azure.ai.voicelive.aio import connect
from azure.identity.aio import DefaultAzureCredential

async with connect(
endpoint=os.environ['AZURE_COGNITIVE_SERVICES_ENDPOINT'],
credential=DefaultAzureCredential(),
model='gpt-4o-realtime-preview',
credential_scopes=['https://cognitiveservices.azure.com/.default']
) as conn:
# 使用連線
```

正在使用「azure-ai-voicelive-py」。 Azure Voice Live 有哪些語音選項？

預期結果:

Azure Voice Live 支援這些內建語音：alloy（中性）、echo（溫暖）、shimmer（專業）、sage（權威）、coral（友善）、ash（低沉）、ballad（表現力）、verse（說故事）。Azure 也提供 AzureStandardVoice、AzureCustomVoice 和 AzurePersonalVoice 模型。

正在使用「azure-ai-voicelive-py」。如何處理語音對話中的中斷？

預期結果:

透過監聽 speech_started 事件並取消目前回應來處理中斷：```python
async for event in conn:
if event.type == 'input_audio_buffer.speech_started':
await conn.response.cancel()
await conn.output_audio_buffer.clear()
```

安全審計

安全

v1 • 2/24/2026

Documentation skill providing reference material for Azure AI Voice Live SDK. Static findings are false positives - scanner detected markdown code fences as shell commands, placeholder URLs as network calls, and example code patterns as security issues. No executable code or malicious behavior present.

已掃描檔案

315

分析行數

發現項

審計總數

未發現安全問題

審計者: claude

品質評分

架構

100

可維護性

內容

社群

100

安全

100

規範符合性

你能建構什麼

語音助理開發

使用 Azure AI 服務建構可即時回應使用者語音的互動式語音助理

客服機器人

為自動化的客戶支援建立具有自然語音互動的對話式 AI 代理程式

無障礙工具

為無障礙應用程式開發語音控制介面

試試這些提示

基本語音連線

展示如何使用 Python 的 DefaultAzureCredential 設定基本的 Azure AI Voice Live 連線

音訊串流設定

建立一個 Python 範例，將麥克風的音訊串流至 Azure Voice Live 並播放回應

工作階段設定

事件處理模式

為 Azure Voice Live 撰寫完整的事件處理模式，以處理音訊轉錄文字、函式呼叫並處理中斷

最佳實務

在生產環境中使用 DefaultAzureCredential 而非 API 金鑰
根據使用案例設定適當的輪詢偵測設定（server_vad 或 semantic_vad）
處理連線錯誤並實作重新連線邏輯以確保應用程式穩健
使用符合硬體功能的適當音訊格式（預設為 24kHz 的 PCM16）

避免

避免在原始程式碼中硬編碼 API 金鑰 - 使用環境變數或 Azure Key Vault
不要跳過連線中斷和 API 錯誤的錯誤處理
避免在事件迴圈中執行封鎖作業 - 正確使用 async/await
不要假設持續的音訊串流 - 實作適當的緩衝和流量控制

常見問題

什麼是 Azure AI Voice Live SDK？

Azure AI Voice Live SDK 是用於建構即時雙向語音 AI 應用程式的 Python 程式庫。它可啟用與 Azure AI 服務之間的音訊串流，以進行語音互動。

我需要 Azure 訂用帳戶嗎？

是的，您需要 Azure 認知服務訂用帳戶，並啟用語音服務。您將需要端點 URL 和適當的驗證認證。

支援哪些音訊格式？

Azure Voice Live 支援 PCM16（預設 24kHz）、PCM16-8000hz、PCM16-16000hz、g711_ulaw 和 g711_alaw 格式。

輪詢偵測如何運作？

輪詢偵測使用語音活動偵測（VAD）來偵測使用者何時停止說話。您可以使用 server_vad（預設）、azure_semantic_vad（更智慧）或停用它以進行手動輪詢控制。

可以使用自訂語音嗎？

是的，Azure 透過 AzureCustomVoice 和 AzurePersonalVoice 模型支援自訂語音，以及內建語音如 alloy、echo 和 shimmer。

這適合用於生產環境嗎？

是的，Azure AI Voice Live 專為生產應用程式設計。使用 DefaultAzureCredential 進行安全驗證，並實作適當的錯誤處理以確保可靠運作。

開發者詳情

作者

sickn33

授權

MIT

儲存庫

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-voicelive-py

引用

main

檔案結構

📄 SKILL.md