Azure AI Transcription SDK for Python
Azure AIでオーディオを文字起こし
オーディオファイルやリアルタイムストリームの正確な音声テキスト変換が必要です。このスキルはバッチ処理とストリーミングサポート付きでAzure AI TranscriptionのPython SDK統合を提供します。
Télécharger le ZIP du skill
Importer dans Claude
Allez dans Paramètres → Capacités → Skills → Importer un skill
Activez et commencez à utiliser
Tester
Utilisation de "Azure AI Transcription SDK for Python". Transcribe audio file at https://storage.example.com/meeting.wav
Résultat attendu:
文字起こしジョブが送信されました。ジョブID: abc123。ステータス: 処理中。完了すると、ダイアライゼーションが有効の場合はタイムスタンプと言語ラベルを含むテキストセグメントが結果に含まれます。
Utilisation de "Azure AI Transcription SDK for Python". Set up real-time transcription for English audio
Résultat attendu:
ストリーミング文字起こしセッションが初期化されました。ロケール: en-US。オーディオが処理されるにつれて、テキストイベントが出力されます。
Audit de sécurité
SûrThis is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.
Score de qualité
Ce que vous pouvez construire
会議の文字起こし
話者識別により録音された会議や電話会議を文字起こし
メディアコンテンツの字幕
オーディオトラックからビデオコンテンツ用のタイムスタンプ付き字幕を生成
カスタマーセンター分析
分析と品質保証のために顧客通話Recordingをテキストに変換
Essayez ces prompts
Use the Azure AI Transcription skill to transcribe the audio file at URL https://example.com/meeting.wav with diarization enabled.
Use the Azure AI Transcription skill to transcribe multiple audio files from these URLs: [list URLs]. Enable diarization and use en-US locale.
Use the Azure AI Transcription skill to set up real-time transcription for a live audio stream. Configure for English locale.
Use the Azure AI Transcription skill to transcribe video audio and generate SRT subtitle file with timestamps. The video is at https://example.com/presentation.mp4.
Bonnes pratiques
- 複数話者のオーディオを文字起こすときは、各話者を識別するためにダイアライゼーションを有効にしてください
- 1分以上のファイルはバッチ文字起こしを使用して、コストと信頼性を最適化してください
- 既知の言語の文字起こし精度を向上させるためにロケールパラメータを指定してください
Éviter
- DefaultAzureCredentialの使用 - このクライアントはサブスクリプションキー認証のみをサポートしています
- 結果を取得する前に文字起こしジョブの状態を確認せずにオーディオを処理すること
- リアルタイムストリームの文字起こしセッションクリーンアップを処理しないこと
Foire aux questions
どのような認証方法がサポートされていますか?
ローカルのオーディオファイルを直接文字起こしできますか?
話者ダイアライゼーションとは何ですか?
タイムスタンプはどのように提供されますか?
どのようなオーディオ形式がサポートされていますか?
多言語文字起こしに使用できますか?
Détails du développeur
Auteur
sickn33Licence
MIT
Dépôt
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-transcription-pyRéf
main
Structure de fichiers
📄 SKILL.md