Azure AI VoiceLive SDK for Java
Создание приложений голосового интерфейса в реальном времени с помощью Azure AI
Разработчикам требуется способ интеграции двунаправленных голосовых разговоров в реальном времени в приложения Java. Этот навык предоставляет полные примеры кода и лучшие практики для реализации голосового ИИ с использованием Azure AI VoiceLive SDK с потоковой передачей по WebSocket.
Скачать ZIP навыка
Загрузить в Claude
Перейдите в Settings → Capabilities → Skills → Upload skill
Включите и начните использовать
Протестировать
Использование «Azure AI VoiceLive SDK for Java». Создайте VoiceLive клиент с DefaultAzureCredential
Ожидаемый результат:
VoiceLiveAsyncClient client = new VoiceLiveClientBuilder()
.endpoint(System.getenv("AZURE_VOICELIVE_ENDPOINT"))
.credential(new DefaultAzureCredentialBuilder().build())
.buildAsyncClient();
Использование «Azure AI VoiceLive SDK for Java». Настройте определение смены говорящего для естественного разговора
Ожидаемый результат:
ServerVadTurnDetection turnDetection = new ServerVadTurnDetection()
.setThreshold(0.5)
.setPrefixPaddingMs(300)
.setSilenceDurationMs(500)
.setInterruptResponse(true)
.setAutoTruncate(true);
Аудит безопасности
БезопасноPrompt-only documentation skill containing code examples for Azure AI VoiceLive SDK. Static analysis found 0 files scanned with 0 potential security issues. Risk score: 0/100. No suspicious patterns detected. Skill provides legitimate documentation for Microsoft Azure service with no executable code.
Оценка качества
Что вы можете построить
Голосовой бот для обслуживания клиентов
Создание интерактивного голосового помощника для поддержки клиентов, который обрабатывает запросы в реальном вр��мени, используя естественную речь
Разработка инструментов доступности
Создание приложений с голосовым управлением для пользователей, которые предпочитают голосовое взаимодействие текстовым интерфейсам
Голосовой интерфейс управления IoT
Реализация голосового управления для устройств IoT с двунаправленной связью с низкой задержкой
Попробуйте эти промпты
Покажите, как настроить базовый VoiceLiveAsyncClient в Java с аутентификацией по API ключу, используя Azure AI VoiceLive SDK.
Как настроить VoiceLiveSessionOptions с определением смены говорящего, выбором голоса и настройками формата аудио для естественного течения разговора?
Напишите код Java для обработки голосовых событий, включая обнаружение начала/остановки речи, потоковую передачу аудио-дельт и обработку ошибок в сессии VoiceLive.
Покажите, как интегрировать вызов функций с VoiceLive, чтобы ИИ-помощник мог выполнять реальные действия, такие как поиск погоды, во время разговора.
Лучшие практики
- Используйте DefaultAzureCredential вместо API ключей для производственных развертываний, чтобы использовать управляемые идентификационные данные Azure
- Настройте ServerVadTurnDetection с соответствующим порогом и длительностью тишины в соответствии с вашим случаем использования для естественного течения разговора
- Всегда реализуйте соответствующую обработку ошибок и логику переподключения для производственных голосовых приложений
Избегать
- Не хардкодите API ключи в исходном коде - используйте переменные окружения или Azure Key Vault
- Избегайте блокирующих вызовов в реактивных потоках - используйте неблокирующие шаблоны везде
- Не пропускайте валидацию формата аудио - убедитесь, что вход соответствует требованиям 24kHz 16-bit PCM
Часто задаваемые вопросы
Какой формат аудио требуется для Azure AI VoiceLive?
Как выполнить аутентификацию с Azure AI VoiceLive?
Какие голоса доступны для Azure AI VoiceLive?
Могу ли я использовать вызов функций с VoiceLive?
Как работает определение смены говорящего в VoiceLive?
В чем разница между модальностями TEXT и AUDIO?
Сведения для разработчиков
Автор
sickn33Лицензия
MIT
Репозиторий
https://github.com/sickn33/antigravity-awesome_skills/tree/main/skills/azure-ai-voicelive-javaСсылка
main
Структура файлов
📄 SKILL.md