Azure AI Transcription SDK for Python
Audio mit Azure AI transkribieren
Benötigen Sie präzise Spracherkennung für Audiodateien oder Echtzeit-Streams. Diese Skill bietet Python SDK-Integration für Azure AI Transcription mit Batch-Verarbeitung und Streaming-Unterstützung.
Die Skill-ZIP herunterladen
In Claude hochladen
Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen
Einschalten und loslegen
Teste es
Verwendung von "Azure AI Transcription SDK for Python". Audiodatei unter https://storage.example.com/meeting.wav transkribieren
Erwartetes Ergebnis:
Der Transkriptionsauftrag wird eingereicht. Job ID: abc123. Status: InProgress. Nach Abschluss enthält das Ergebnis Textsegmente mit Zeitstempeln und Sprecherlabels, wenn Diarisierung aktiviert ist.
Verwendung von "Azure AI Transcription SDK for Python". Echtzeit-Transkription für englisches Audio einrichten
Erwartetes Ergebnis:
Streaming-Transkriptionssitzung initialisiert. Locale: en-US. Der Stream gibt transkribierte Text-Events während der Audioverarbeitung aus.
Sicherheitsaudit
SicherThis is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.
Qualitätsbewertung
Was du bauen kannst
Meeting-Transkription
Aufgezeichnete Meetings oder Telefonkonferenzen mit Sprecheridentifizierung transkribieren
Medieninhalt-Untertitel
Zeitgestempelte Untertitel für Videoinhalte aus Audiospuren generieren
Call-Center-Analytik
Kundengespräch-Aufzeichnungen für Analyse und Qualitätssicherung in Text umwandeln
Probiere diese Prompts
Use the Azure AI Transcription skill to transcribe the audio file at URL https://example.com/meeting.wav with diarization enabled.
Use the Azure AI Transcription skill to transcribe multiple audio files from these URLs: [list URLs]. Enable diarization and use en-US locale.
Use the Azure AI Transcription skill to set up real-time transcription for a live audio stream. Configure for English locale.
Use the Azure AI Transcription skill to transcribe video audio and generate SRT subtitle file with timestamps. The video is at https://example.com/presentation.mp4.
Bewährte Verfahren
- Diarisierung bei Multi-Sprecher-Audio aktivieren, um jeden Sprecher zu identifizieren
- Batch-Transkription für Dateien über 1 Minute verwenden, um Kosten und Zuverlässigkeit zu optimieren
- Locale-Parameter angeben, um Transkriptionsgenauigkeit für bekannte Sprachen zu verbessern
Vermeiden
- DefaultAzureCredential verwenden - dieser Client unterstützt nur Subscription-Key-Authentifizierung
- Audio verarbeiten, ohne den Transkriptions-Jobstatus vor dem Abrufen der Ergebnisse zu prüfen
- Transkriptionssitzungsbereinigung für Echtzeit-Streams nicht durchführen
Häufig gestellte Fragen
Welche Authentifizierungsmethoden werden unterstützt?
Kann ich lokale Audiodateien direkt transkribieren?
Was ist Sprecher-Diarisierung?
Wie werden Zeitstempel bereitgestellt?
Welche Audioformate werden unterstützt?
Kann ich dies für mehrsprachige Transkription verwenden?
Entwicklerdetails
Autor
sickn33Lizenz
MIT
Repository
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-transcription-pyRef
main
Dateistruktur
📄 SKILL.md