Fähigkeiten @azure/ai-voicelive (JavaScript/TypeScript)

🎙️

@azure/ai-voicelive (JavaScript/TypeScript)

Name: @azure/ai-voicelive (JavaScript/TypeScript)
Author: sickn33

Sicher

Echtzeit-Sprach-KI-Apps mit Azure erstellen

Diese Skill bietet umfassende Dokumentation und Codebeispiele für die Entwicklung von Echtzeit-Sprach-KI-Anwendungen mit dem Azure AI Voice Live SDK. Es ermöglicht Entwicklern, Sprachassistenten, konversationelle KI und Sprach-zu-Sprach-Anwendungen in JavaScript und TypeScript zu erstellen.

Unterstützt: Claude Codex Code(CC)

📊 70 Angemessen

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "@azure/ai-voicelive (JavaScript/TypeScript)". Wie erstelle ich einen VoiceLiveClient mit DefaultAzureCredential?

Erwartetes Ergebnis:

import { DefaultAzureCredential } from '@azure/identity';
import { VoiceLiveClient } from '@azure/ai-voicelive';

const credential = new DefaultAzureCredential();
const endpoint = process.env.AZURE_VOICELIVE_ENDPOINT!;
const client = new VoiceLiveClient(endpoint, credential);

Verwendung von "@azure/ai-voicelive (JavaScript/TypeScript)". Welche Sprachoptionen sind verfügbar?

Erwartetes Ergebnis:

Azure Standard-Stimmen (en-US-AvaNeural, etc.), Azure Custom-Stimmen mit Endpoint-ID, Azure Personal-Stimmen für Sprecherklonung, und OpenAI-Stimmen (alloy, echo, shimmer).

Verwendung von "@azure/ai-voicelive (JavaScript/TypeScript)". Wie behandle ich Fehler?

Erwartetes Ergebnis:

Verwenden Sie den onError-Handler in Ihrer Subscription, um VoiceLiveConnectionError, VoiceLiveAuthenticationError und VoiceLiveProtocolError-Typen abzufangen.

Sicherheitsaudit

Sicher

v1 • 2/24/2026

This is a documentation-only skill containing guidance for using the Azure AI Voice Live SDK. No executable code was detected. The skill provides usage examples for a legitimate Azure service. No security concerns identified.

Gescannte Dateien

Analysierte Zeilen

befunde

Gesamtzahl Audits

Keine Sicherheitsprobleme gefunden

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Sprachassistenten erstellen

Erstellen Sie interaktive Sprachassistenten, die Sprache verstehen, mit KI-generiertem Audio antworten und mehrstufige Gespräche führen können.

Echtzeit-Transkription

Implementieren Sie Live-Sprache-zu-Text-Transkription mit niedriger Latenz für Kundenservice, Barrierefreiheit oder Dokumentationsanwendungen.

Konversationelle Chatbots

Erstellen Sie sprachfähige Chatbots, die mit Benutzern natürliche gesprochene Gespräche unter Verwendung von GPT-Modellen führen können.

Probiere diese Prompts

Grundlegender Voice-Client-Setup

Zeigen Sie mir, wie ich einen grundlegenden VoiceLiveClient mit Microsoft Entra ID-Authentifizierung in TypeScript einrichten kann.

Sitzungskonfiguration

Konfigurieren Sie eine Sprachsitzung mit Text- und Audio-Modalitäten, benutzerdefinierten Anweisungen und Azure Semantic VAD Turn-Erkennung.

Event-Handling

Implementieren Sie Event-Handler für Streaming-Audio-Delta, Text-Delta und Transkriptionsereignisse unter Verwendung des Subscription-Musters.

Funktionsaufrufe

Richten Sie Funktionsaufruf-Tools in der Sitzungskonfiguration ein und behandeln Sie Funktionsaufruf-Ereignisse, um externe APIs zu integrieren.

Bewährte Verfahren

Verwenden Sie immer DefaultAzureCredential anstatt API-Schlüssel hart zu codieren, für sichere Authentifizierung
Verwenden Sie Azure Semantic VAD für bessere Turn-Erkennung als grundlegende Server-VAD
Bereinigen Sie Subscriptions, indem Sie subscription.close() aufrufen, wenn Sie fertig sind, um Speicherlecks zu verhindern

Vermeiden

API-Schlüssel direkt im Quellcode hart codieren anstatt Umgebungsvariablen oder Entra ID zu verwenden
Verbindungs-, Authentifizierungs- und Protokollfehler nicht separat behandeln
Nur Audio-Modalität ohne Text festlegen - dies viele konversationelle Funktionen

Häufig gestellte Fragen

Welche Authentifizierungsmethoden werden unterstützt?

Microsoft Entra ID (empfohlen) und API-Schlüssel-Authentifizierung mit AzureKeyCredential.

Welche Umgebungen werden unterstützt?

Node.js LTS (20+) und moderne Browser (Chrome, Firefox, Safari, Edge) mit einem Bundler.

Welche Audioformate werden unterstützt?

PCM16 bei 24kHz (Standard), PCM16-8kHz, PCM16-16kHz, G711 ulaw und G711 alaw.

Wie funktioniert die Turn-Erkennung?

Server VAD verwendet Sprachaktivitätserkennung. Azure Semantic VAD verwendet KI, um den Gesprächskontext für besseres Turn-Taking zu verstehen.

Kann ich benutzerdefinierte Stimmen verwenden?

Ja, Azure Custom-Stimmen mit Endpoint-ID und Azure Personal-Stimmen für Sprecherprofil-Klonung werden unterstützt.

Welche Modelle werden unterstützt?

GPT-4o-realtime-preview, GPT-4o-mini-realtime-preview und phi4-mm-realtime für kostengünstige Anwendungen.

Entwicklerdetails

Autor

sickn33

Lizenz

MIT

Repository

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-voicelive-ts

Ref

main

Dateistruktur

📄 SKILL.md