Question 1

Welche Audioformate unterstützt die Azure Speech to Text REST API?

Accepted Answer

Die Azure Speech to Text REST API unterstützt WAV mit PCM-Codec bei 16kHz Mono (empfohlen) und OGG OPUS-Codec. Das Audio darf nicht länger als 60 Sekunden sein.

Question 2

Muss ich das Azure Speech SDK installieren, um diesen Skill zu verwenden?

Accepted Answer

Nein, dieser Skill verwendet die REST API direkt mit der requests-Bibliothek. Keine SDK-Installation erforderlich. Installieren Sie einfach das requests-Paket.

Question 3

Wie erhalte ich Azure Speech to Text-Anmeldedaten?

Accepted Answer

Erstellen Sie ein Azure-Abonnement, dann eine Speech-Ressource im Azure-Portal. Gehen Sie zur Seite "Schlüssel und Endpunkt" der Ressource, um Ihren API-Schlüssel und Ihre Region zu erhalten.

Question 4

Was ist der Unterschied zwischen einfachem und detailliertem Antwortformat?

Accepted Answer

Das einfache Format gibt nur den DisplayText zurück. Das detaillierte Format gibt Konfidenzwerte, lexikalische Form, ITN (inverse Textnormalisierung) und maskierte ITN für jedes Ergebnis zurück.

Question 5

Kann ich Audio in anderen Sprachen als Englisch transkribieren?

Accepted Answer

Ja, Azure Speech to Text unterstützt viele Sprachen. Geben Sie die Sprache mit dem language-Abfrageparameter an (z.B. de-DE für Deutsch, fr-FR für Französisch).

Question 6

Wie gehe ich mit Authentifizierungsfehlern um?

Accepted Answer

Überprüfen Sie, ob Ihr API-Schlüssel korrekt ist und nicht abgelaufen. Stellen Sie sicher, dass die Region in Ihrer URL mit Ihrer Ressourcenregion übereinstimmt. Verwenden Sie Bearer-Token für die Produktion, um Schlüsseloffenlegung zu vermeiden.

Azure Speech to Text REST API for Short Audio

Teste es

Sicherheitsaudit

Qualitätsbewertung

Was du bauen kannst

Sprachnotizen transkribieren

Automatische Anruftranskription

Transkription mehrsprachiger Inhalte

Probiere diese Prompts

Bewährte Verfahren

Vermeiden

Häufig gestellte Fragen

Entwicklerdetails