Fähigkeiten Azure AI Transcription SDK for Python

📦

Azure AI Transcription SDK for Python

Name: Azure AI Transcription SDK for Python
Author: sickn33

Sicher

Audio mit Azure AI transkribieren

Benötigen Sie präzise Spracherkennung für Audiodateien oder Echtzeit-Streams. Diese Skill bietet Python SDK-Integration für Azure AI Transcription mit Batch-Verarbeitung und Streaming-Unterstützung.

Unterstützt: Claude Codex Code(CC)

📊 69 Angemessen

Die Skill-ZIP herunterladen

In Claude hochladen

Gehe zu Einstellungen → Fähigkeiten → Skills → Skill hochladen

Einschalten und loslegen

Teste es

Verwendung von "Azure AI Transcription SDK for Python". Audiodatei unter https://storage.example.com/meeting.wav transkribieren

Erwartetes Ergebnis:

Der Transkriptionsauftrag wird eingereicht. Job ID: abc123. Status: InProgress. Nach Abschluss enthält das Ergebnis Textsegmente mit Zeitstempeln und Sprecherlabels, wenn Diarisierung aktiviert ist.

Verwendung von "Azure AI Transcription SDK for Python". Echtzeit-Transkription für englisches Audio einrichten

Erwartetes Ergebnis:

Streaming-Transkriptionssitzung initialisiert. Locale: en-US. Der Stream gibt transkribierte Text-Events während der Audioverarbeitung aus.

Sicherheitsaudit

Sicher

v1 • 2/24/2026

This is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.

Gescannte Dateien

Analysierte Zeilen

befunde

Gesamtzahl Audits

Keine Sicherheitsprobleme gefunden

Auditiert von: claude

Qualitätsbewertung

Architektur

100

Wartbarkeit

Inhalt

Community

100

Sicherheit

Spezifikationskonformität

Was du bauen kannst

Meeting-Transkription

Aufgezeichnete Meetings oder Telefonkonferenzen mit Sprecheridentifizierung transkribieren

Medieninhalt-Untertitel

Zeitgestempelte Untertitel für Videoinhalte aus Audiospuren generieren

Call-Center-Analytik

Kundengespräch-Aufzeichnungen für Analyse und Qualitätssicherung in Text umwandeln

Probiere diese Prompts

Einfache Batch-Transkription

Use the Azure AI Transcription skill to transcribe the audio file at URL https://example.com/meeting.wav with diarization enabled.

Multi-Datei-Transkription

Use the Azure AI Transcription skill to transcribe multiple audio files from these URLs: [list URLs]. Enable diarization and use en-US locale.

Echtzeit-Stream-Transkription

Use the Azure AI Transcription skill to set up real-time transcription for a live audio stream. Configure for English locale.

Untertitel-Generierung

Use the Azure AI Transcription skill to transcribe video audio and generate SRT subtitle file with timestamps. The video is at https://example.com/presentation.mp4.

Bewährte Verfahren

Diarisierung bei Multi-Sprecher-Audio aktivieren, um jeden Sprecher zu identifizieren
Batch-Transkription für Dateien über 1 Minute verwenden, um Kosten und Zuverlässigkeit zu optimieren
Locale-Parameter angeben, um Transkriptionsgenauigkeit für bekannte Sprachen zu verbessern

Vermeiden

DefaultAzureCredential verwenden - dieser Client unterstützt nur Subscription-Key-Authentifizierung
Audio verarbeiten, ohne den Transkriptions-Jobstatus vor dem Abrufen der Ergebnisse zu prüfen
Transkriptionssitzungsbereinigung für Echtzeit-Streams nicht durchführen

Häufig gestellte Fragen

Welche Authentifizierungsmethoden werden unterstützt?

Dieses SDK unterstützt nur Subscription-Key-Authentifizierung über die TRANSCRIPTION_KEY Umgebungsvariable. DefaultAzureCredential wird nicht unterstützt.

Kann ich lokale Audiodateien direkt transkribieren?

Für Batch-Transkription müssen Audiodateien über HTTPS-URLs zugänglich sein. Erwägen Sie, diese zuerst in Azure Blob Storage hochzuladen. Echtzeit-Transkription kann lokale Audiodateien akzeptieren.

Was ist Sprecher-Diarisierung?

Diarisierung identifiziert und labelt verschiedene Sprecher im Audio. Aktivieren mit diarization_enabled=True, um Sprecherlabels im Transkriptionsergebnis zu erhalten.

Wie werden Zeitstempel bereitgestellt?

Transkriptionsergebnisse enthalten Offset-Zeitstempel für jedes Wort oder Segment, was Untertitelgenerierung und synchronisierte Audio-Text-Anwendungen ermöglicht.

Welche Audioformate werden unterstützt?

Azure AI Transcription unterstützt gängige Audioformate einschließlich WAV, MP3 und FLAC. Prüfen Sie die Azure-Dokumentation für die vollständige Liste unterstützter Formate.

Kann ich dies für mehrsprachige Transkription verwenden?

Ja, geben Sie den Locale-Parameter beim Starten der Transkription an. Unterstützte Locale umfassen en-US, en-GB, es-ES, fr-FR, de-DE und viele andere.

Entwicklerdetails

Autor

sickn33

Lizenz

MIT

Repository

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-transcription-py

Ref

main

Dateistruktur

📄 SKILL.md