Compétences @azure/ai-voicelive (JavaScript/TypeScript)

🎙️

@azure/ai-voicelive (JavaScript/TypeScript)

Name: @azure/ai-voicelive (JavaScript/TypeScript)
Author: sickn33

Sûr

Créer des applications vocales IA en temps réel avec Azure

Cette compétence fournit une documentation complète et des exemples de code pour créer des applications vocales IA en temps réel à l'aide du SDK Azure AI Voice Live. Elle permet aux développeurs de créer des assistants vocaux, des IA conversationnelles et des applications de reconnaissance vocale en JavaScript et TypeScript.

Prend en charge: Claude Codex Code(CC)

📊 70 Adéquat

Télécharger le ZIP du skill

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

Activez et commencez à utiliser

Tester

Utilisation de "@azure/ai-voicelive (JavaScript/TypeScript)". Comment créer un VoiceLiveClient avec DefaultAzureCredential ?

Résultat attendu:

import { DefaultAzureCredential } from '@azure/identity';
import { VoiceLiveClient } from '@azure/ai-voicelive';

const credential = new DefaultAzureCredential();
const endpoint = process.env.AZURE_VOICELIVE_ENDPOINT!;
const client = new VoiceLiveClient(endpoint, credential);

Utilisation de "@azure/ai-voicelive (JavaScript/TypeScript)". Quelles options vocales sont disponibles ?

Résultat attendu:

Voix Azure Standard (en-US-AvaNeural, etc.), voix Azure Custom avec ID de point de terminaison, voix Azure Personal pour le clonage de haut-parleur, et voix OpenAI (alloy, echo, shimmer).

Utilisation de "@azure/ai-voicelive (JavaScript/TypeScript)". Comment gérer les erreurs ?

Résultat attendu:

Utilisez le gestionnaire onError dans votre abonnement pour intercepter les types VoiceLiveConnectionError, VoiceLiveAuthenticationError et VoiceLiveProtocolError.

Audit de sécurité

Sûr

v1 • 2/24/2026

This is a documentation-only skill containing guidance for using the Azure AI Voice Live SDK. No executable code was detected. The skill provides usage examples for a legitimate Azure service. No security concerns identified.

Fichiers analysés

Lignes analysées

résultats

Total des audits

Aucun problème de sécurité trouvé

Audité par: claude

Score de qualité

Architecture

100

Maintenabilité

Contenu

Communauté

100

Sécurité

Conformité aux spécifications

Ce que vous pouvez construire

Créer des assistants vocaux

Créez des assistants vocaux interactifs capables de comprendre la parole, de répondre avec de l'audio généré par IA et de gérer des conversations multi-tours.

Transcription en temps réel

Implémentez une transcription de parole en texte en direct avec une latence faible pour le service client, l'accessibilité ou les applications de documentation.

Chatbots conversationnels

Créez des chatbots vocaux capables d'avoir des conversations parlées naturelles avec les utilisateurs en utilisant les modèles GPT.

Essayez ces prompts

Configuration de base du client vocal

Montrez-moi comment configurer un VoiceLiveClient basic avec l'authentification Microsoft Entra ID en TypeScript.

Configuration de session

Configurez une session vocale avec les modalités texte et audio, des instructions personnalisées et la détection de tour Azure Semantic VAD.

Gestion des événements

Implémentez des gestionnaires pour les événements de delta audio en streaming, de delta texte et de transcription en utilisant le modèle d'abonnement.

Appel de fonction

Configurez les outils d'appel de fonction dans la configuration de session et gérez les événements d'appel de fonction pour intégrer des API externes.

Bonnes pratiques

Utilisez toujours DefaultAzureCredential au lieu de coder en dur les clés API pour une authentification sécurisée
Utilisez Azure Semantic VAD pour une meilleure détection de tour que le VAD serveur basique
Nettoyez les abonnements en appelant subscription.close() à la fin pour éviter les fuites de mémoire

Éviter

Coder en dur les clés API directement dans le code source au lieu d'utiliser des variables d'environnement ou Entra ID
Ne pas gérer séparément les erreurs de connexion, d'authentification et de protocole
Définir uniquement la modalité audio sans texte - cela décompose muchas fonctionnalités conversationnelles

Foire aux questions

Quelles méthodes d'authentification sont prises en charge ?

Microsoft Entra ID (recommandé) et authentification par clé API avec AzureKeyCredential.

Quels environnements sont pris en charge ?

Node.js LTS (20+) et navigateurs modernes (Chrome, Firefox, Safari, Edge) avec un bundler.

Quels formats audio sont pris en charge ?

PCM16 à 24kHz (défaut), PCM16-8kHz, PCM16-16kHz, G711 ulaw et G711 alaw.

Comment fonctionne la détection de tour ?

Le VAD serveur utilise la détection d'activité vocale. Azure Semantic VAD utilise l'IA pour comprendre le contexte conversationnel pour de meilleures prises de tour.

Puis-je utiliser des voix personnalisées ?

Oui, les voix Azure Custom avec ID de point de terminaison et les voix Azure Personal pour le clonage de profil de haut-parleur sont prises en charge.

Quels modèles sont pris en charge ?

GPT-4o-realtime-preview, GPT-4o-mini-realtime-preview et phi4-mm-realtime pour les applications rentables.

Détails du développeur

Auteur

sickn33

Licence

MIT

Dépôt

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-voicelive-ts

Réf

main

Structure de fichiers

📄 SKILL.md