Question 1

どのような認証方法がサポートされていますか？

Accepted Answer

このSDKはTRANSCRIPTION_KEY環境変数によるサブスクリプションキー認証のみをサポートしています。DefaultAzureCredentialはサポートされていません。

Question 2

ローカルのオーディオファイルを直接文字起こしできますか？

Accepted Answer

バッチ文字起こしでは、オディオフファイルはHTTPS URLでアクセス可能である必要があります。まずAzure Blob Storageにアップロードすることを検討してください。リアルタイム文字起こしはローカルオーディオファイルを受け入れることができます。

Question 3

話者ダイアライゼーションとは何ですか？

Accepted Answer

ダイアライゼーションはオーディオ内の異なる話者を識別してラベル付けします。文字起こし出力で話者ラベルを取得するにはdiarization_enabled=Trueで有効にしてください。

Question 4

タイムスタンプはどのように提供されますか？

Accepted Answer

文字起こし結果には各単語またはセグメントのオフセットタイムスタンプが含まれるため、字幕生成と同期オーディオテキストアプリケーションが可能になります。

Question 5

どのようなオーディオ形式がサポートされていますか？

Accepted Answer

Azure AI TranscriptionはWAV、MP3、FLACなどの一般的なオーディオ形式をサポートしています。サポートされている形式の完全なリストについてはAzureドキュメントを確認してください。

Question 6

多言語文字起こしに使用できますか？

Accepted Answer

はい。文字起こしを開始する際にロケールパラメータを指定してください。サポートされているロケールにはen-US、en-GB、es-ES、fr-FR、de-DEなどが含まれます。

Azure AI Transcription SDK for Python

テストする