@azure/ai-voicelive (JavaScript/TypeScript)
Construye Aplicaciones de IA de Voz en Tiempo Real con Azure
Esta skill proporciona documentación completa y ejemplos de código para construir aplicaciones de IA de voz en tiempo real utilizando el Azure AI Voice Live SDK. Permite a los desarrolladores crear asistentes de voz, IA conversacional y aplicaciones de speech-to-speech en JavaScript y TypeScript.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 ¿Cómo creo un VoiceLiveClient con DefaultAzureCredential?
预期结果:
import { DefaultAzureCredential } from '@azure/identity';
import { VoiceLiveClient } from '@azure/ai-voicelive';
const credential = new DefaultAzureCredential();
const endpoint = process.env.AZURE_VOICELIVE_ENDPOINT!;
const client = new VoiceLiveClient(endpoint, credential);
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 ¿Qué opciones de voz están disponibles?
预期结果:
Voces Azure Standard (en-US-AvaNeural, etc.), voces Azure Custom con endpoint ID, voces Azure Personal para clonación de locutor y voces OpenAI (alloy, echo, shimmer).
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 ¿Cómo manejo errores?
预期结果:
Usa el manejador onError en tu suscripción para capturar los tipos VoiceLiveConnectionError, VoiceLiveAuthenticationError y VoiceLiveProtocolError.
安全审计
安全This is a documentation-only skill containing guidance for using the Azure AI Voice Live SDK. No executable code was detected. The skill provides usage examples for a legitimate Azure service. No security concerns identified.
质量评分
你能构建什么
Construir Asistentes de Voz
Crea asistentes de voz interactivos que pueden entender el habla, responder con audio generado por IA y manejar conversaciones de múltiples turnos.
Transcripción en Tiempo Real
Implementa transcripción speech-to-text en vivo con baja latencia para servicio al cliente, accesibilidad o aplicaciones de documentación.
Chatbots Conversacionales
Construye chatbots habilitados para voz que pueden tener conversaciones habladas naturales con usuarios utilizando modelos GPT.
试试这些提示
Muéstrame cómo configurar un VoiceLiveClient básico usando autenticación Microsoft Entra ID en TypeScript.
Configura una sesión de voz con modalidades de texto y audio, instrucciones personalizadas y detección de turnos Azure Semantic VAD.
Implementa manejadores de eventos para streaming audio delta, text delta y eventos de transcripción usando el patrón de suscripción.
Configura herramientas de function calling en la configuración de sesión y maneja eventos de function call para integrar APIs externas.
最佳实践
- Usa siempre DefaultAzureCredential en lugar de hardcodear API keys para autenticación segura
- Usa Azure Semantic VAD para mejor detección de turnos que el server VAD básico
- Limpia las suscripciones llamando a subscription.close() cuando termines para prevenir memory leaks
避免
- Hardcodear API keys directamente en el código fuente en lugar de usar variables de entorno o Entra ID
- No manejar por separado errores de conexión, autenticación y protocolo
- Configurar solo la modalidad audio sin texto - esto rompe muchas características conversacionales