Azure Speech to Text REST API for Short Audio
Audio mit Azure Speech to Text REST API transkribieren
Transkribieren Sie kurze Audiodateien (bis zu 60 Sekunden) mit der Azure Speech to Text REST API ohne Installation des Speech SDK. Dieser Skill bietet sofort einsatzbereite Python-Codes für Authentifizierung, Audio-Formatierung und Fehlerbehandlung.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "Azure Speech to Text REST API for Short Audio". Transcribe audio.wav using Azure Speech to Text with detailed format
Erwartetes Ergebnis:
Transkription erfolgreich!
Anzeigetext: Wie ist das Wetter heute?
Konfidenz: 90,5%
Die Audiodatei wurde mit Azure Speech to Text REST API im detaillierten Antwortformat transkribiert.
Verwendung von "Azure Speech to Text REST API for Short Audio". How do I authenticate with Azure Speech to Text using bearer tokens?
Erwartetes Ergebnis:
Sie können die Authentifizierung mit Bearer-Token für verbesserte Sicherheit durchführen. Das Token ist 10 Minuten gültig. So implementieren Sie es:
1. Access-Token vom Token-Endpunkt abrufen
2. Das Token im Authorization-Header verwenden
3. Das Token zwischenspeichern und vor Ablauf erneuern
Dieser Ansatz wird für Produktionsanwendungen empfohlen.
Sicherheitsaudit
SicherThis is a prompt-only documentation skill that provides guidance for integrating with Azure Speech to Text REST API. Static analysis found no suspicious patterns, no executable code, and no risk factors. The skill consists of documentation and code examples for legitimate API integration. No security concerns identified.
Qualitätsbewertung
Was du bauen kannst
Sprachnotizen transkribieren
Kurze Sprachaufnahmen in Text für Notizen und Dokumentation umwandeln
Automatische Anruftranskription
Kurze Telefongesprächsaufnahmen für Analyse und Dokumentation transkribieren
Transkription mehrsprachiger Inhalte
Audioinhalte in mehreren Sprachen mit Azure Sprachunterstützung transkribieren
Probiere diese Prompts
Use the Azure Speech to Text REST API skill to transcribe the audio file at path [AUDIO_FILE_PATH] to text. Use language [LANGUAGE_CODE] (e.g., en-US).
Use the Azure Speech to Text REST API skill to transcribe [AUDIO_FILE_PATH] using detailed format to get confidence scores. Language: [LANGUAGE]. Handle errors gracefully.
Use the Azure Speech to Text REST API skill to transcribe [AUDIO_FILE_PATH] asynchronously. Show how to implement the async version with aiohttp for better performance.
Use the Azure Speech to Text REST API skill to write a transcription function that handles all RecognitionStatus values (Success, NoMatch, InitialSilenceTimeout, BabbleTimeout, Error) with appropriate responses.
Bewährte Verfahren
- Verwenden Sie WAV PCM Format bei 16kHz Mono für beste Erkennungsgenauigkeit
- Bearer-Token für 9 Minuten zwischenspeichern, um wiederholte Authentifizierung zu vermeiden
- Chunked Transfer Encoding für niedrigere Latenz bei größeren Dateien aktivieren
Vermeiden
- Senden Sie keine Audiodateien länger als 60 Sekunden - verwenden Sie stattdessen die Batch Transcription API
- Verwenden Sie dies nicht für Echtzeit-Streaming - verwenden Sie Speech SDK Streaming
- API-Schlüssel nicht im Quellcode fest codieren - verwenden Sie Umgebungsvariablen
Häufig gestellte Fragen
Welche Audioformate unterstützt die Azure Speech to Text REST API?
Muss ich das Azure Speech SDK installieren, um diesen Skill zu verwenden?
Wie erhalte ich Azure Speech to Text-Anmeldedaten?
Was ist der Unterschied zwischen einfachem und detailliertem Antwortformat?
Kann ich Audio in anderen Sprachen als Englisch transkribieren?
Wie gehe ich mit Authentifizierungsfehlern um?
Entwicklerdetails
Autor
sickn33Lizenz
MIT
Repository
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-speech-to-text-rest-pyRef
main
Dateistruktur
📄 SKILL.md