Навыки Azure AI VoiceLive SDK for Java
📦

Azure AI VoiceLive SDK for Java

Безопасно

Créer des applications vocales en temps réel avec Azure AI

Les développeurs ont besoin d'un moyen d'intégrer des conversations vocales bidirectionnelles en temps réel dans des applications Java. Cette compétence fournit des exemples de code complets et des bonnes pratiques pour implémenter l'IA vocale en utilisant Azure AI VoiceLive SDK avec le streaming WebSocket.

Поддерживает: Claude Codex Code(CC)
📊 69 Адекватно
1

Скачать ZIP навыка

2

Загрузить в Claude

Перейдите в Settings → Capabilities → Skills → Upload skill

3

Включите и начните использовать

Протестировать

Использование «Azure AI VoiceLive SDK for Java». Créer un client VoiceLive avec DefaultAzureCredential

Ожидаемый результат:

VoiceLiveAsyncClient client = new VoiceLiveClientBuilder()
.endpoint(System.getenv("AZURE_VOICELIVE_ENDPOINT"))
.credential(new DefaultAzureCredentialBuilder().build())
.buildAsyncClient();

Использование «Azure AI VoiceLive SDK for Java». Configurer la détection de tour de parole pour une conversation naturelle

Ожидаемый результат:

ServerVadTurnDetection turnDetection = new ServerVadTurnDetection()
.setThreshold(0.5)
.setPrefixPaddingMs(300)
.setSilenceDurationMs(500)
.setInterruptResponse(true)
.setAutoTruncate(true);

Аудит безопасности

Безопасно
v1 • 2/24/2026

Prompt-only documentation skill containing code examples for Azure AI VoiceLive SDK. Static analysis found 0 files scanned with 0 potential security issues. Risk score: 0/100. No suspicious patterns detected. Skill provides legitimate documentation for Microsoft Azure service with no executable code.

0
Просканировано файлов
0
Проанализировано строк
0
находки
1
Всего аудитов
Проблем безопасности не найдено
Проверено: claude

Оценка качества

38
Архитектура
100
Сопровождаемость
87
Контент
31
Сообщество
100
Безопасность
74
Соответствие спецификации

Что вы можете построить

Bot vocal pour le service client

Construire un assistant vocal interactif pour le support client qui gère les demandes en temps réel en utilisant la parole naturelle

Développement d'outils d'accessibilité

Créer des applications avec fonctionnalités vocales pour les utilisateurs qui préfèrent l'interaction vocale aux interfaces basées sur le texte

Interface de contrôle vocal IoT

Implémenter le contrôle vocal pour les appareils IoT avec une communication bidirectionnelle à faible latence

Попробуйте эти промпты

Configuration de base du client vocal
Montrez-moi comment configurer un VoiceLiveAsyncClient de base en Java avec une authentification par clé API en utilisant le Azure AI VoiceLive SDK.
Configuration de la session vocale
Comment configurer VoiceLiveSessionOptions avec la détection de tour de parole, la sélection de voix et les paramètres de format audio pour un flux de conversation naturel ?
Gestion des événements vocaux
Écrivez du code Java pour gérer les événements vocaux, y compris la détection de début/fin de parole, le streaming audio delta et la gestion des erreurs dans la session VoiceLive.
Implémenter l'appel de fonctions
Montrez-moi comment intégrer l'appel de fonctions avec VoiceLive pour permettre à l'assistant IA d'exécuter des actions réelles comme des recherches de météo pendant la conversation.

Лучшие практики

  • Utilisez DefaultAzureCredential au lieu des clés API pour les déploiements en production afin de tirer parti des identités managées Azure
  • Configurez ServerVadTurnDetection avec un seuil et une durée de silence appropriés pour correspondre à votre cas d'usage pour un flux de conversation naturel
  • Implémentez toujours une gestion appropriée des erreurs et une logique de reconnexion pour les applications vocales en production

Избегать

  • Ne codez pas en dur les clés API dans le code source - utilisez plutôt des variables d'environnement ou Azure Key Vault
  • Évitez les appels bloquants dans les flux réactifs - utilisez des modèles non-bloquants tout au long
  • Ne sautez pas la validation du format audio - assurez-vous que l'entrée correspond aux exigences 24 kHz 16 bits PCM

Часто задаваемые вопросы

Quel format audio Azure AI VoiceLive requiert-il ?
Azure AI VoiceLive nécessite une fréquence d'échantillonnage de 24 kHz, PCM 16 bits, canal mono, PCM signé little-endian.
Comment s'authentifier avec Azure AI VoiceLive ?
Vous pouvez utiliser AzureKeyCredential avec une clé API, ou DefaultAzureCredential pour la prise en charge de l'identité managée en production.
Quelles voix sont disponibles pour Azure AI VoiceLive ?
Le SDK prend en charge les voix OpenAI (ALLOY, ASH, BALLAD, CORAL, ECHO, SAGE, SHIMMER, VERSE) et les voix Azure, y compris les voix Standard, Custom et Personal.
Puis-je utiliser l'appel de fonctions avec VoiceLive ?
Oui, vous pouvez définir des fonctions en utilisant VoiceLiveFunctionDefinition et les passer via setTools() dans VoiceLiveSessionOptions.
Comment fonctionne la détection de tour de parole dans VoiceLive ?
ServerVadTurnDetection utilise la détection d'activité vocale pour détecter automatiquement quand l'utilisateur commence et arrête de parler, avec un seuil et une durée de silence configurables.
Quelle est la différence entre les modalités TEXT et AUDIO ?
La modalité TEXT envoie/reçoit du texte, la modalité AUDIO envoie/reçoit de l'audio. Vous pouvez combiner les deux en utilisant Arrays.asList(InteractionModality.TEXT, InteractionModality.AUDIO).

Сведения для разработчиков

Автор

sickn33

Лицензия

MIT

Ссылка

main

Структура файлов

📄 SKILL.md