Compétences Azure AI Transcription SDK for Python
📦

Azure AI Transcription SDK for Python

Sûr

Azure AIでオーディオを文字起こし

オーディオファイルやリアルタイムストリームの正確な音声テキスト変換が必要です。このスキルはバッチ処理とストリーミングサポート付きでAzure AI TranscriptionのPython SDK統合を提供します。

Prend en charge: Claude Codex Code(CC)
🥉 73 Bronze
1

Télécharger le ZIP du skill

2

Importer dans Claude

Allez dans Paramètres → Capacités → Skills → Importer un skill

3

Activez et commencez à utiliser

Tester

Utilisation de "Azure AI Transcription SDK for Python". Transcribe audio file at https://storage.example.com/meeting.wav

Résultat attendu:

文字起こしジョブが送信されました。ジョブID: abc123。ステータス: 処理中。完了すると、ダイアライゼーションが有効の場合はタイムスタンプと言語ラベルを含むテキストセグメントが結果に含まれます。

Utilisation de "Azure AI Transcription SDK for Python". Set up real-time transcription for English audio

Résultat attendu:

ストリーミング文字起こしセッションが初期化されました。ロケール: en-US。オーディオが処理されるにつれて、テキストイベントが出力されます。

Audit de sécurité

Sûr
v1 • 2/24/2026

This is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.

0
Fichiers analysés
0
Lignes analysées
0
résultats
1
Total des audits
Aucun problème de sécurité trouvé
Audité par: claude

Score de qualité

38
Architecture
100
Maintenabilité
87
Contenu
50
Communauté
100
Sécurité
83
Conformité aux spécifications

Ce que vous pouvez construire

会議の文字起こし

話者識別により録音された会議や電話会議を文字起こし

メディアコンテンツの字幕

オーディオトラックからビデオコンテンツ用のタイムスタンプ付き字幕を生成

カスタマーセンター分析

分析と品質保証のために顧客通話Recordingをテキストに変換

Essayez ces prompts

基本的なバッチ文字起こし
Use the Azure AI Transcription skill to transcribe the audio file at URL https://example.com/meeting.wav with diarization enabled.
マルチファイル文字起こし
Use the Azure AI Transcription skill to transcribe multiple audio files from these URLs: [list URLs]. Enable diarization and use en-US locale.
リアルタイムストリーム文字起こし
Use the Azure AI Transcription skill to set up real-time transcription for a live audio stream. Configure for English locale.
字幕生成
Use the Azure AI Transcription skill to transcribe video audio and generate SRT subtitle file with timestamps. The video is at https://example.com/presentation.mp4.

Bonnes pratiques

  • 複数話者のオーディオを文字起こすときは、各話者を識別するためにダイアライゼーションを有効にしてください
  • 1分以上のファイルはバッチ文字起こしを使用して、コストと信頼性を最適化してください
  • 既知の言語の文字起こし精度を向上させるためにロケールパラメータを指定してください

Éviter

  • DefaultAzureCredentialの使用 - このクライアントはサブスクリプションキー認証のみをサポートしています
  • 結果を取得する前に文字起こしジョブの状態を確認せずにオーディオを処理すること
  • リアルタイムストリームの文字起こしセッションクリーンアップを処理しないこと

Foire aux questions

どのような認証方法がサポートされていますか?
このSDKはTRANSCRIPTION_KEY環境変数によるサブスクリプションキー認証のみをサポートしています。DefaultAzureCredentialはサポートされていません。
ローカルのオーディオファイルを直接文字起こしできますか?
バッチ文字起こしでは、オディオフファイルはHTTPS URLでアクセス可能である必要があります。まずAzure Blob Storageにアップロードすることを検討してください。リアルタイム文字起こしはローカルオーディオファイルを受け入れることができます。
話者ダイアライゼーションとは何ですか?
ダイアライゼーションはオーディオ内の異なる話者を識別してラベル付けします。文字起こし出力で話者ラベルを取得するにはdiarization_enabled=Trueで有効にしてください。
タイムスタンプはどのように提供されますか?
文字起こし結果には各単語またはセグメントのオフセットタイムスタンプが含まれるため、字幕生成と同期オーディオテキストアプリケーションが可能になります。
どのようなオーディオ形式がサポートされていますか?
Azure AI TranscriptionはWAV、MP3、FLACなどの一般的なオーディオ形式をサポートしています。サポートされている形式の完全なリストについてはAzureドキュメントを確認してください。
多言語文字起こしに使用できますか?
はい。文字起こしを開始する際にロケールパラメータを指定してください。サポートされているロケールにはen-US、en-GB、es-ES、fr-FR、de-DEなどが含まれます。

Détails du développeur

Structure de fichiers

📄 SKILL.md