Навыки Azure AI VoiceLive SDK for Java

📦

Azure AI VoiceLive SDK for Java

Name: Azure AI VoiceLive SDK for Java
Author: sickn33

Безопасно

Создание приложений голосового интерфейса в реальном времени с помощью Azure AI

Разработчикам требуется способ интеграции двунаправленных голосовых разговоров в реальном времени в приложения Java. Этот навык предоставляет полные примеры кода и лучшие практики для реализации голосового ИИ с использованием Azure AI VoiceLive SDK с потоковой передачей по WebSocket.

Поддерживает: Claude Codex Code(CC)

⚠️ 68 Плохо

Скачать ZIP навыка

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

Включите и начните использовать

Протестировать

Использование «Azure AI VoiceLive SDK for Java». Создайте VoiceLive клиент с DefaultAzureCredential

Ожидаемый результат:

VoiceLiveAsyncClient client = new VoiceLiveClientBuilder()
.endpoint(System.getenv("AZURE_VOICELIVE_ENDPOINT"))
.credential(new DefaultAzureCredentialBuilder().build())
.buildAsyncClient();

Использование «Azure AI VoiceLive SDK for Java». Настройте определение смены говорящего для естественного разговора

Ожидаемый результат:

ServerVadTurnDetection turnDetection = new ServerVadTurnDetection()
.setThreshold(0.5)
.setPrefixPaddingMs(300)
.setSilenceDurationMs(500)
.setInterruptResponse(true)
.setAutoTruncate(true);

Аудит безопасности

Безопасно

v1 • 2/24/2026

Prompt-only documentation skill containing code examples for Azure AI VoiceLive SDK. Static analysis found 0 files scanned with 0 potential security issues. Risk score: 0/100. No suspicious patterns detected. Skill provides legitimate documentation for Microsoft Azure service with no executable code.

Просканировано файлов

Проанализировано строк

находки

Всего аудитов

Проблем безопасности не найдено

Проверено: claude

Оценка качества

Архитектура

100

Сопровождаемость

Контент

Сообщество

100

Безопасность

Соответствие спецификации

Что вы можете построить

Голосовой бот для обслуживания клиентов

Создание интерактивного голосового помощника для поддержки клиентов, который обрабатывает запросы в реальном вр��мени, используя естественную речь

Разработка инструментов доступности

Создание приложений с голосовым управлением для пользователей, которые предпочитают голосовое взаимодействие текстовым интерфейсам

Голосовой интерфейс управления IoT

Реализация голосового управления для устройств IoT с двунаправленной связью с низкой задержкой

Попробуйте эти промпты

Базовая настройка голосового клиента

Покажите, как настроить базовый VoiceLiveAsyncClient в Java с аутентификацией по API ключу, используя Azure AI VoiceLive SDK.

Настройка голосовой сессии

Как настроить VoiceLiveSessionOptions с определением смены говорящего, выбором голоса и настройками формата аудио для естественного течения разговора?

Обработка голосовых событий

Напишите код Java для обработки голосовых событий, включая обнаружение начала/остановки речи, потоковую передачу аудио-дельт и обработку ошибок в сессии VoiceLive.

Реализация вызова функций

Покажите, как интегрировать вызов функций с VoiceLive, чтобы ИИ-помощник мог выполнять реальные действия, такие как поиск погоды, во время разговора.

Лучшие практики

Используйте DefaultAzureCredential вместо API ключей для производственных развертываний, чтобы использовать управляемые идентификационные данные Azure
Настройте ServerVadTurnDetection с соответствующим порогом и длительностью тишины в соответствии с вашим случаем использования для естественного течения разговора
Всегда реализуйте соответствующую обработку ошибок и логику переподключения для производственных голосовых приложений

Избегать

Не хардкодите API ключи в исходном коде - используйте переменные окружения или Azure Key Vault
Избегайте блокирующих вызовов в реактивных потоках - используйте неблокирующие шаблоны везде
Не пропускайте валидацию формата аудио - убедитесь, что вход соответствует требованиям 24kHz 16-bit PCM

Часто задаваемые вопросы

Какой формат аудио требуется для Azure AI VoiceLive?

Azure AI VoiceLive требует частоту дискретизации 24kHz, 16-bit PCM, моно-канал, подписанный PCM little-endian формат.

Как выполнить аутентификацию с Azure AI VoiceLive?

Вы можете использовать AzureKeyCredential с API ключом или DefaultAzureCredential для поддержки управля��мой идентификации в производственной среде.

Какие голоса доступны для Azure AI VoiceLive?

SDK поддерживает голоса OpenAI (ALLOY, ASH, BALLAD, CORAL, ECHO, SAGE, SHIMMER, VERSE) и голоса Azure, включая стандартные, кастомные и персональные голоса.

Могу ли я использовать вызов функций с VoiceLive?

Да, вы можете определить функции, используя VoiceLiveFunctionDefinition, и передать их через setTools() в VoiceLiveSessionOptions.

Как работает определение смены говорящего в VoiceLive?

ServerVadTurnDetection использует обнаружение голосовой активности для автоматического определения момента, когда пользователь начинает и прекращает говорить, с настраиваемым порогом и длительностью тишины.

В чем разница между модальностями TEXT и AUDIO?

Модальность TEXT отправляет/получает текст, модальность AUDIO отправляет/получает аудио. Вы можете объединить оба, используя Arrays.asList(InteractionModality.TEXT, InteractionModality.AUDIO).

Сведения для разработчиков

Автор

sickn33

Лицензия

MIT

Репозиторий

https://github.com/sickn33/antigravity-awesome_skills/tree/main/skills/azure-ai-voicelive-java

Ссылка

main

Структура файлов

📄 SKILL.md