Fähigkeiten Azure AI Transcription SDK for Python
📦

Azure AI Transcription SDK for Python

Sicher

Audio mit Azure AI transkribieren

Benötigen Sie präzise Spracherkennung für Audiodateien oder Echtzeit-Streams. Diese Skill bietet Python SDK-Integration für Azure AI Transcription mit Batch-Verarbeitung und Streaming-Unterstützung.

Unterstützt: Claude Codex Code(CC)
🥉 73 Bronze
1

Die Skill-ZIP herunterladen

2

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

3

Einschalten und loslegen

Teste es

Verwendung von "Azure AI Transcription SDK for Python". Audiodatei unter https://storage.example.com/meeting.wav transkribieren

Erwartetes Ergebnis:

Der Transkriptionsauftrag wird eingereicht. Job ID: abc123. Status: InProgress. Nach Abschluss enthält das Ergebnis Textsegmente mit Zeitstempeln und Sprecherlabels, wenn Diarisierung aktiviert ist.

Verwendung von "Azure AI Transcription SDK for Python". Echtzeit-Transkription für englisches Audio einrichten

Erwartetes Ergebnis:

Streaming-Transkriptionssitzung initialisiert. Locale: en-US. Der Stream gibt transkribierte Text-Events während der Audioverarbeitung aus.

Sicherheitsaudit

Sicher
v1 • 2/24/2026

This is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.

0
Gescannte Dateien
0
Analysierte Zeilen
0
befunde
1
Gesamtzahl Audits
Keine Sicherheitsprobleme gefunden
Auditiert von: claude

Qualitätsbewertung

38
Architektur
100
Wartbarkeit
87
Inhalt
50
Community
100
Sicherheit
83
Spezifikationskonformität

Was du bauen kannst

Meeting-Transkription

Aufgezeichnete Meetings oder Telefonkonferenzen mit Sprecheridentifizierung transkribieren

Medieninhalt-Untertitel

Zeitgestempelte Untertitel für Videoinhalte aus Audiospuren generieren

Call-Center-Analytik

Kundengespräch-Aufzeichnungen für Analyse und Qualitätssicherung in Text umwandeln

Probiere diese Prompts

Einfache Batch-Transkription
Use the Azure AI Transcription skill to transcribe the audio file at URL https://example.com/meeting.wav with diarization enabled.
Multi-Datei-Transkription
Use the Azure AI Transcription skill to transcribe multiple audio files from these URLs: [list URLs]. Enable diarization and use en-US locale.
Echtzeit-Stream-Transkription
Use the Azure AI Transcription skill to set up real-time transcription for a live audio stream. Configure for English locale.
Untertitel-Generierung
Use the Azure AI Transcription skill to transcribe video audio and generate SRT subtitle file with timestamps. The video is at https://example.com/presentation.mp4.

Bewährte Verfahren

  • Diarisierung bei Multi-Sprecher-Audio aktivieren, um jeden Sprecher zu identifizieren
  • Batch-Transkription für Dateien über 1 Minute verwenden, um Kosten und Zuverlässigkeit zu optimieren
  • Locale-Parameter angeben, um Transkriptionsgenauigkeit für bekannte Sprachen zu verbessern

Vermeiden

  • DefaultAzureCredential verwenden - dieser Client unterstützt nur Subscription-Key-Authentifizierung
  • Audio verarbeiten, ohne den Transkriptions-Jobstatus vor dem Abrufen der Ergebnisse zu prüfen
  • Transkriptionssitzungsbereinigung für Echtzeit-Streams nicht durchführen

Häufig gestellte Fragen

Welche Authentifizierungsmethoden werden unterstützt?
Dieses SDK unterstützt nur Subscription-Key-Authentifizierung über die TRANSCRIPTION_KEY Umgebungsvariable. DefaultAzureCredential wird nicht unterstützt.
Kann ich lokale Audiodateien direkt transkribieren?
Für Batch-Transkription müssen Audiodateien über HTTPS-URLs zugänglich sein. Erwägen Sie, diese zuerst in Azure Blob Storage hochzuladen. Echtzeit-Transkription kann lokale Audiodateien akzeptieren.
Was ist Sprecher-Diarisierung?
Diarisierung identifiziert und labelt verschiedene Sprecher im Audio. Aktivieren mit diarization_enabled=True, um Sprecherlabels im Transkriptionsergebnis zu erhalten.
Wie werden Zeitstempel bereitgestellt?
Transkriptionsergebnisse enthalten Offset-Zeitstempel für jedes Wort oder Segment, was Untertitelgenerierung und synchronisierte Audio-Text-Anwendungen ermöglicht.
Welche Audioformate werden unterstützt?
Azure AI Transcription unterstützt gängige Audioformate einschließlich WAV, MP3 und FLAC. Prüfen Sie die Azure-Dokumentation für die vollständige Liste unterstützter Formate.
Kann ich dies für mehrsprachige Transkription verwenden?
Ja, geben Sie den Locale-Parameter beim Starten der Transkription an. Unterstützte Locale umfassen en-US, en-GB, es-ES, fr-FR, de-DE und viele andere.

Entwicklerdetails

Dateistruktur

📄 SKILL.md