Habilidades Azure AI VoiceLive SDK for Java
📦

Azure AI VoiceLive SDK for Java

Seguro

Criar Aplicativos de Voz em Tempo Real com Azure AI

Os desenvolvedores precisam de uma maneira de integrar conversas de voz bidirecionais em tempo real em aplicativos Java. Esta skill fornece exemplos de código completos e melhores práticas para implementar voz AI usando o Azure AI VoiceLive SDK com streaming WebSocket.

Suporta: Claude Codex Code(CC)
🥉 72 Bronze
1

Baixar o ZIP da skill

2

Upload no Claude

Vá em Configurações → Capacidades → Skills → Upload skill

3

Ative e comece a usar

Testar

A utilizar "Azure AI VoiceLive SDK for Java". Create a VoiceLive client with DefaultAzureCredential

Resultado esperado:

VoiceLiveAsyncClient client = new VoiceLiveClientBuilder()
.endpoint(System.getenv("AZURE_VOICELIVE_ENDPOINT"))
.credential(new DefaultAzureCredentialBuilder().build())
.buildAsyncClient();

A utilizar "Azure AI VoiceLive SDK for Java". Configure turn detection for natural conversation

Resultado esperado:

ServerVadTurnDetection turnDetection = new ServerVadTurnDetection()
.setThreshold(0.5)
.setPrefixPaddingMs(300)
.setSilenceDurationMs(500)
.setInterruptResponse(true)
.setAutoTruncate(true);

Auditoria de Segurança

Seguro
v1 • 2/24/2026

Prompt-only documentation skill containing code examples for Azure AI VoiceLive SDK. Static analysis found 0 files scanned with 0 potential security issues. Risk score: 0/100. No suspicious patterns detected. Skill provides legitimate documentation for Microsoft Azure service with no executable code.

0
Arquivos analisados
0
Linhas analisadas
0
achados
1
Total de auditorias
Nenhum problema de segurança encontrado
Auditado por: claude

Pontuação de qualidade

38
Arquitetura
100
Manutenibilidade
87
Conteúdo
50
Comunidade
100
Segurança
74
Conformidade com especificações

O Que Você Pode Construir

Bot de Voz para Atendimento ao Cliente

Crie um assistente de voz interativo para suporte ao cliente que manipula consultas em tempo real usando fala natural

Desenvolvimento de Ferramentas de Acessibilidade

Crie aplicativos habilitado para voz para usuários que preferem interação por voz em vez de interfaces baseadas em texto

Interface de Controle de Voz para IoT

Implemente controle de voz para dispositivos IoT com comunicação bidirecional de baixa latência

Tente Estes Prompts

Configuração Básica do Cliente de Voz
Mostre-me como configurar um VoiceLiveAsyncClient básico em Java com autenticação de chave de API usando o Azure AI VoiceLive SDK.
Configurar Sessão de Voz
Como configuro VoiceLiveSessionOptions com detecção de turnos, seleção de voz e configurações de formato de áudio para um fluxo de conversa natural?
Manipular Eventos de Voz
Escreva código Java para manipular eventos de voz, incluindo detecção de início/fim de fala, streaming delta de áudio e tratamento de erros na sessão VoiceLive.
Implementar Chamadas de Função
Mostre-me como integrar chamadas de função com o VoiceLive para habilitar o assistente de IA a executar ações reais, como consultas de clima durante a conversa.

Melhores Práticas

  • Use DefaultAzureCredential em vez de chaves de API para implantações de produção para aproveitar identidades gerenciadas do Azure
  • Configure ServerVadTurnDetection com limite e duração de silêncio apropriados para corresponder ao seu caso de uso para um fluxo de conversa natural
  • Sempre implemente tratamento de erros adequado e lógica de reconexão para aplicativos de voz de produção

Evitar

  • Não codifique chaves de API no código-fonte - use variáveis de ambiente ou Azure Key Vault
  • Evite chamadas bloqueantes em streams reativos - use padrões não bloqueantes em todo o processo
  • Não pule a validação de formato de áudio - certifique-se de que a entrada corresponde aos requisitos de PCM de 16 bits a 24kHz

Perguntas Frequentes

Qual formato de áudio o Azure AI VoiceLive requer?
Azure AI VoiceLive requer taxa de amostragem de 24kHz, PCM de 16 bits, canal mono, formato PCM little-endian com sinal.
Como me autentico com o Azure AI VoiceLive?
Você pode usar AzureKeyCredential com chave de API, ou DefaultAzureCredential para suporte a identidade gerenciada em produção.
Quais vozes estão disponíveis para o Azure AI VoiceLive?
O SDK suporta vozes OpenAI (ALLOY, ASH, BALLAD, CORAL, ECHO, SAGE, SHIMMER, VERSE) e vozes do Azure, incluindo Standard, Custom e Personal.
Posso usar chamadas de função com o VoiceLive?
Sim, você pode definir funções usando VoiceLiveFunctionDefinition e passá-las via setTools() em VoiceLiveSessionOptions.
Como a detecção de turnos funciona no VoiceLive?
ServerVadTurnDetection usa detecção de atividade de voz para detectar automaticamente quando o usuário começa e para de falar, com limite configurável e duração de silêncio.
Qual é a diferença entre as modalidades TEXT e AUDIO?
A modalidade TEXT envia/recebe texto, a modalidade AUDIO envia/recebe áudio. Você pode combinar ambas usando Arrays.asList(InteractionModality.TEXT, InteractionModality.AUDIO).

Detalhes do Desenvolvedor

Estrutura de arquivos

📄 SKILL.md