Compétences Azure AI Transcription SDK for Python
📦

Azure AI Transcription SDK for Python

Sûr

Transcrire l'audio avec Azure AI

Besoin d'une transcription parole-texte précise pour des fichiers audio ou des flux en temps réel. Cette compétence fournit une intégration Python SDK pour Azure AI Transcription avec traitement par lots et prise en charge du streaming.

Prend en charge: Claude Codex Code(CC)
🥉 73 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "Azure AI Transcription SDK for Python". Transcribe audio file at https://storage.example.com/meeting.wav

Résultat attendu:

The transcription job is submitted. Job ID: abc123. Status: InProgress. Once complete, the result will include text segments with timestamps and speaker labels if diarization is enabled.

Utilisation de "Azure AI Transcription SDK for Python". Set up real-time transcription for English audio

Résultat attendu:

Streaming transcription session initialized. Locale: en-US. The stream will output transcribed text events as audio is processed.

Audit de sécurité

Sûr
v1 • 2/24/2026

This is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.

0
Fichiers analysés
0
Lignes analysées
0
résultats
1
Total des audits
Aucun problème de sécurité trouvé
Audité par: claude

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
100
Sécurité
83
Conformité aux spécifications

Ce que vous pouvez construire

Transcription de réunion

Transcrire des réunions enregistrées ou des appels de conférence avec identification des locuteurs

Sous-titres de contenu multimédia

Générer des sous-titres horodatés pour du contenu vidéo à partir de pistes audio

Analytique des centres d'appels

Convertir les enregistrements d'appels clients en texte pour l'analyse et l'assurance qualité

Essayez ces prompts

Transcription par lots de base
Use the Azure AI Transcription skill to transcribe the audio file at URL https://example.com/meeting.wav with diarization enabled.
Transcription de plusieurs fichiers
Use the Azure AI Transcription skill to transcribe multiple audio files from these URLs: [list URLs]. Enable diarization and use en-US locale.
Transcription de flux en temps réel
Use the Azure AI Transcription skill to set up real-time transcription for a live audio stream. Configure for English locale.
Génération de sous-titres
Use the Azure AI Transcription skill to transcribe video audio and generate SRT subtitle file with timestamps. The video is at https://example.com/presentation.mp4.

Bonnes pratiques

  • Activer la diarisation lors de la transcription d'audio multi-locuteurs pour identifier chaque locuteur
  • Utiliser la transcription par lots pour les fichiers de plus d'une minute afin d'optimiser les coûts et la fiabilité
  • Spécifier le paramètre de région pour améliorer la précision de la transcription pour des langues connues

Éviter

  • Utiliser DefaultAzureCredential - ce client prend en charge uniquement l'authentification par clé d'abonnement
  • Traiter l'audio sans vérifier l'état du travail de transcription avant de récupérer les résultats
  • Ne pas gérer le nettoyage de la session de transcription pour les flux en temps réel

Foire aux questions

Quelles méthodes d'authentification sont prises en charge ?
Ce SDK prend en charge uniquement l'authentification par clé d'abonnement via la variable d'environnement TRANSCRIPTION_KEY. DefaultAzureCredential n'est pas pris en charge.
Puis-je transcrire directement des fichiers audio locaux ?
Pour la transcription par lots, les fichiers audio doivent être accessibles via des URL HTTPS. Envisagez de les télécharger d'abord dans Azure Blob Storage. La transcription en temps réel peut accepter des fichiers audio locaux.
Qu'est-ce que la diarisation des locuteurs ?
La diarisation identifie et étiquette différents locuteurs dans l'audio. Activez avec diarization_enabled=True pour obtenir des étiquettes de locuteur dans la sortie de transcription.
Comment les horodatages sont-ils fournis ?
Les résultats de transcription incluent des horodatages de décalage pour chaque mot ou segment, permettant la génération de sous-titres et des applications audio-texte synchronisées.
Quels formats audio sont pris en charge ?
Azure AI Transcription prend en charge les formats audio courants, notamment WAV, MP3 et FLAC. Consultez la documentation Azure pour la liste complète des formats pris en charge.
Puis-je utiliser ceci pour la transcription multilingue ?
Oui, spécifiez le paramètre de région lors du démarrage de la transcription. Les régions prises en charge incluent en-US, en-GB, es-ES, fr-FR, de-DE et bien d'autres.

Détails du développeur

Structure de fichiers

📄 SKILL.md