@azure/ai-voicelive (JavaScript/TypeScript)
Crie Aplicativos de Voz em Tempo Real com Azure
Esta skill fornece documentação abrangente e exemplos de código para construir aplicativos de voz em tempo real usando o Azure AI Voice Live SDK. Permite que desenvolvedores criem assistentes de voz, IA conversacional e aplicativos de fala para fala em JavaScript e TypeScript.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 Como crio um VoiceLiveClient com DefaultAzureCredential?
预期结果:
import { DefaultAzureCredential } from '@azure/identity';
import { VoiceLiveClient } from '@azure/ai-voicelive';
const credential = new DefaultAzureCredential();
const endpoint = process.env.AZURE_VOICELIVE_ENDPOINT!;
const client = new VoiceLiveClient(endpoint, credential);
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 Quais opções de voz estão disponíveis?
预期结果:
Vozes Azure Standard (en-US-AvaNeural, etc.), vozes Azure Custom com endpoint ID, Azure Personal voices para clonagem de speaker, e vozes OpenAI (alloy, echo, shimmer).
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 Como manipulo erros?
预期结果:
Use o manipulador onError na sua assinatura para capturar tipos VoiceLiveConnectionError, VoiceLiveAuthenticationError e VoiceLiveProtocolError.
安全审计
安全This is a documentation-only skill containing guidance for using the Azure AI Voice Live SDK. No executable code was detected. The skill provides usage examples for a legitimate Azure service. No security concerns identified.
质量评分
你能构建什么
Crie Assistentes de Voz
Crie assistentes de voz interativos que podem entender fala, responder com áudio gerado por IA e lidar com conversas multiturno.
Transcrição em Tempo Real
Implemente transcrição de fala para texto ao vivo com baixa latência para atendimento ao cliente, acessibilidade ou aplicativos de documentação.
Chatbots Conversacionais
Construa chatbots habilitados para voz que podem ter conversas faladas naturais com usuários usando modelos GPT.
试试这些提示
Mostre-me como configurar um VoiceLiveClient básico usando autenticação do Microsoft Entra ID em TypeScript.
Configure uma sessão de voz com modalidades de texto e áudio, instruções personalizadas e detecção de turnos com Azure Semantic VAD.
Implemente manipuladores de eventos para delta de áudio streaming, delta de texto e eventos de transcrição usando o padrão de assinatura.
Configure ferramentas de chamada de função na configuração da sessão e manipule eventos de chamada de função para integrar APIs externas.
最佳实践
- Sempre use DefaultAzureCredential em vez de codificar chaves de API para autenticação segura
- Use Azure Semantic VAD para melhor detecção de turnos do que server VAD básico
- Limpe as assinaturas chamando subscription.close() quando terminar para evitar vazamentos de memória
避免
- Codificar chaves de API diretamente no código-fonte em vez de usar variáveis de ambiente ou Entra ID
- Não manipular erros de conexão, autenticação e protocolo separadamente
- Definir apenas modalidade de áudio sem texto - isso quebra muitos recursos conversacionais