技能 azure-ai-voicelive-py
🎙️

azure-ai-voicelive-py

安全

使用 Azure 建構即時語音 AI 應用程式

使用 Azure AI Voice Live SDK 建立具有即時雙向音訊串流功能的互動式語音 AI 應用程式。此技能提供建構生產級語音助理的完整參考文件。

支持: Claude Codex Code(CC)
📊 71 充足
1

下载技能 ZIP

2

在 Claude 中上传

前往 设置 → 功能 → 技能 → 上传技能

3

开启并开始使用

测试它

正在使用“azure-ai-voicelive-py”。 如何使用 DefaultAzureCredential 向 Azure Voice Live 進行驗證?

预期结果:

使用 DefaultAzureCredential 進行生產環境驗證:```python
from azure.ai.voicelive.aio import connect
from azure.identity.aio import DefaultAzureCredential

async with connect(
endpoint=os.environ['AZURE_COGNITIVE_SERVICES_ENDPOINT'],
credential=DefaultAzureCredential(),
model='gpt-4o-realtime-preview',
credential_scopes=['https://cognitiveservices.azure.com/.default']
) as conn:
# 使用連線
```

正在使用“azure-ai-voicelive-py”。 Azure Voice Live 有哪些語音選項?

预期结果:

Azure Voice Live 支援這些內建語音:alloy(中性)、echo(溫暖)、shimmer(專業)、sage(權威)、coral(友善)、ash(低沉)、ballad(表現力)、verse(說故事)。Azure 也提供 AzureStandardVoice、AzureCustomVoice 和 AzurePersonalVoice 模型。

正在使用“azure-ai-voicelive-py”。 如何處理語音對話中的中斷?

预期结果:

透過監聽 speech_started 事件並取消目前回應來處理中斷:```python
async for event in conn:
if event.type == 'input_audio_buffer.speech_started':
await conn.response.cancel()
await conn.output_audio_buffer.clear()
```

安全审计

安全
v1 • 2/24/2026

Documentation skill providing reference material for Azure AI Voice Live SDK. Static findings are false positives - scanner detected markdown code fences as shell commands, placeholder URLs as network calls, and example code patterns as security issues. No executable code or malicious behavior present.

1
已扫描文件
315
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude

质量评分

38
架构
100
可维护性
87
内容
22
社区
100
安全
100
规范符合性

你能构建什么

語音助理開發

使用 Azure AI 服務建構可即時回應使用者語音的互動式語音助理

客服機器人

為自動化的客戶支援建立具有自然語音互動的對話式 AI 代理程式

無障礙工具

為無障礙應用程式開發語音控制介面

试试这些提示

基本語音連線
展示如何使用 Python 的 DefaultAzureCredential 設定基本的 Azure AI Voice Live 連線
音訊串流設定
建立一個 Python 範例,將麥克風的音訊串流至 Azure Voice Live 並播放回應
工作階段設定
事件處理模式
為 Azure Voice Live 撰寫完整的事件處理模式,以處理音訊轉錄文字、函式呼叫並處理中斷

最佳实践

  • 在生產環境中使用 DefaultAzureCredential 而非 API 金鑰
  • 根據使用案例設定適當的輪詢偵測設定(server_vad 或 semantic_vad)
  • 處理連線錯誤並實作重新連線邏輯以確保應用程式穩健
  • 使用符合硬體功能的適當音訊格式(預設為 24kHz 的 PCM16)

避免

  • 避免在原始程式碼中硬編碼 API 金鑰 - 使用環境變數或 Azure Key Vault
  • 不要跳過連線中斷和 API 錯誤的錯誤處理
  • 避免在事件迴圈中執行封鎖作業 - 正確使用 async/await
  • 不要假設持續的音訊串流 - 實作適當的緩衝和流量控制

常见问题

什麼是 Azure AI Voice Live SDK?
Azure AI Voice Live SDK 是用於建構即時雙向語音 AI 應用程式的 Python 程式庫。它可啟用與 Azure AI 服務之間的音訊串流,以進行語音互動。
我需要 Azure 訂用帳戶嗎?
是的,您需要 Azure 認知服務訂用帳戶,並啟用語音服務。您將需要端點 URL 和適當的驗證認證。
支援哪些音訊格式?
Azure Voice Live 支援 PCM16(預設 24kHz)、PCM16-8000hz、PCM16-16000hz、g711_ulaw 和 g711_alaw 格式。
輪詢偵測如何運作?
輪詢偵測使用語音活動偵測(VAD)來偵測使用者何時停止說話。您可以使用 server_vad(預設)、azure_semantic_vad(更智慧)或停用它以進行手動輪詢控制。
可以使用自訂語音嗎?
是的,Azure 透過 AzureCustomVoice 和 AzurePersonalVoice 模型支援自訂語音,以及內建語音如 alloy、echo 和 shimmer。
這適合用於生產環境嗎?
是的,Azure AI Voice Live 專為生產應用程式設計。使用 DefaultAzureCredential 進行安全驗證,並實作適當的錯誤處理以確保可靠運作。

开发者详情

文件结构

📄 SKILL.md