@azure/ai-voicelive (JavaScript/TypeScript)
Créer des applications vocales IA en temps réel avec Azure
Cette compétence fournit une documentation complète et des exemples de code pour créer des applications vocales IA en temps réel à l'aide du SDK Azure AI Voice Live. Elle permet aux développeurs de créer des assistants vocaux, des IA conversationnelles et des applications de reconnaissance vocale en JavaScript et TypeScript.
下载技能 ZIP
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
开启并开始使用
测试它
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 Comment créer un VoiceLiveClient avec DefaultAzureCredential ?
预期结果:
import { DefaultAzureCredential } from '@azure/identity';
import { VoiceLiveClient } from '@azure/ai-voicelive';
const credential = new DefaultAzureCredential();
const endpoint = process.env.AZURE_VOICELIVE_ENDPOINT!;
const client = new VoiceLiveClient(endpoint, credential);
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 Quelles options vocales sont disponibles ?
预期结果:
Voix Azure Standard (en-US-AvaNeural, etc.), voix Azure Custom avec ID de point de terminaison, voix Azure Personal pour le clonage de haut-parleur, et voix OpenAI (alloy, echo, shimmer).
正在使用“@azure/ai-voicelive (JavaScript/TypeScript)”。 Comment gérer les erreurs ?
预期结果:
Utilisez le gestionnaire onError dans votre abonnement pour intercepter les types VoiceLiveConnectionError, VoiceLiveAuthenticationError et VoiceLiveProtocolError.
安全审计
安全This is a documentation-only skill containing guidance for using the Azure AI Voice Live SDK. No executable code was detected. The skill provides usage examples for a legitimate Azure service. No security concerns identified.
质量评分
你能构建什么
Créer des assistants vocaux
Créez des assistants vocaux interactifs capables de comprendre la parole, de répondre avec de l'audio généré par IA et de gérer des conversations multi-tours.
Transcription en temps réel
Implémentez une transcription de parole en texte en direct avec une latence faible pour le service client, l'accessibilité ou les applications de documentation.
Chatbots conversationnels
Créez des chatbots vocaux capables d'avoir des conversations parlées naturelles avec les utilisateurs en utilisant les modèles GPT.
试试这些提示
Montrez-moi comment configurer un VoiceLiveClient basic avec l'authentification Microsoft Entra ID en TypeScript.
Configurez une session vocale avec les modalités texte et audio, des instructions personnalisées et la détection de tour Azure Semantic VAD.
Implémentez des gestionnaires pour les événements de delta audio en streaming, de delta texte et de transcription en utilisant le modèle d'abonnement.
Configurez les outils d'appel de fonction dans la configuration de session et gérez les événements d'appel de fonction pour intégrer des API externes.
最佳实践
- Utilisez toujours DefaultAzureCredential au lieu de coder en dur les clés API pour une authentification sécurisée
- Utilisez Azure Semantic VAD pour une meilleure détection de tour que le VAD serveur basique
- Nettoyez les abonnements en appelant subscription.close() à la fin pour éviter les fuites de mémoire
避免
- Coder en dur les clés API directement dans le code source au lieu d'utiliser des variables d'environnement ou Entra ID
- Ne pas gérer séparément les erreurs de connexion, d'authentification et de protocole
- Définir uniquement la modalité audio sans texte - cela décompose muchas fonctionnalités conversationnelles