Azure AI Transcription SDK for Python
Transcrire l'audio avec Azure AI
Besoin d'une transcription parole-texte précise pour des fichiers audio ou des flux en temps réel. Cette compétence fournit une intégration Python SDK pour Azure AI Transcription avec traitement par lots et prise en charge du streaming.
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "Azure AI Transcription SDK for Python". Transcribe audio file at https://storage.example.com/meeting.wav
Résultat attendu:
The transcription job is submitted. Job ID: abc123. Status: InProgress. Once complete, the result will include text segments with timestamps and speaker labels if diarization is enabled.
Utilisation de "Azure AI Transcription SDK for Python". Set up real-time transcription for English audio
Résultat attendu:
Streaming transcription session initialized. Locale: en-US. The stream will output transcribed text events as audio is processed.
Audit de sécurité
SûrThis is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.
Score de qualité
Ce que vous pouvez construire
Transcription de réunion
Transcrire des réunions enregistrées ou des appels de conférence avec identification des locuteurs
Sous-titres de contenu multimédia
Générer des sous-titres horodatés pour du contenu vidéo à partir de pistes audio
Analytique des centres d'appels
Convertir les enregistrements d'appels clients en texte pour l'analyse et l'assurance qualité
Essayez ces prompts
Use the Azure AI Transcription skill to transcribe the audio file at URL https://example.com/meeting.wav with diarization enabled.
Use the Azure AI Transcription skill to transcribe multiple audio files from these URLs: [list URLs]. Enable diarization and use en-US locale.
Use the Azure AI Transcription skill to set up real-time transcription for a live audio stream. Configure for English locale.
Use the Azure AI Transcription skill to transcribe video audio and generate SRT subtitle file with timestamps. The video is at https://example.com/presentation.mp4.
Bonnes pratiques
- Activer la diarisation lors de la transcription d'audio multi-locuteurs pour identifier chaque locuteur
- Utiliser la transcription par lots pour les fichiers de plus d'une minute afin d'optimiser les coûts et la fiabilité
- Spécifier le paramètre de région pour améliorer la précision de la transcription pour des langues connues
Éviter
- Utiliser DefaultAzureCredential - ce client prend en charge uniquement l'authentification par clé d'abonnement
- Traiter l'audio sans vérifier l'état du travail de transcription avant de récupérer les résultats
- Ne pas gérer le nettoyage de la session de transcription pour les flux en temps réel
Foire aux questions
Quelles méthodes d'authentification sont prises en charge ?
Puis-je transcrire directement des fichiers audio locaux ?
Qu'est-ce que la diarisation des locuteurs ?
Comment les horodatages sont-ils fournis ?
Quels formats audio sont pris en charge ?
Puis-je utiliser ceci pour la transcription multilingue ?
Détails du développeur
Auteur
sickn33Licence
MIT
Dépôt
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-transcription-pyRéf
main
Structure de fichiers
📄 SKILL.md