Azure AI Transcription SDK for Python
使用 Azure AI 轉錄音訊
需要對音訊檔案或即時串流進行精準的語音轉文字轉錄。此技能提供 Azure AI Transcription 的 Python SDK 整合,包含批次處理和串流支援。
下載技能 ZIP
在 Claude 中上傳
前往 設定 → 功能 → 技能 → 上傳技能
開啟並開始使用
測試它
正在使用「Azure AI Transcription SDK for Python」。 Transcribe audio file at https://storage.example.com/meeting.wav
預期結果:
轉錄作業已提交。作業 ID:abc123。狀態:進行中。完成後,結果將包含帶有時間戳記的文字區段,以及如果啟用說話者辨識,則會包含說話者標籤。
正在使用「Azure AI Transcription SDK for Python」。 Set up real-time transcription for English audio
預期結果:
串流轉錄工作階段已初始化。地區設定:en-US。當音訊處理時,串流將輸出轉錄的文字事件。
安全審計
安全This is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.
品質評分
你能建構什麼
會議轉錄
轉錄已錄製的會議或電話會議並識別說話者
媒體內容字幕
從音軌產生影片內容的時間戳記字幕
客服中心分析
將客戶電話錄音轉換為文字以進行分析和品質保證
試試這些提示
使用 Azure AI Transcription 技能轉錄位於 URL https://example.com/meeting.wav 的音訊檔案,並啟用說話者辨識。
使用 Azure AI Transcription 技能轉錄以下 URL 的多個音訊檔案:[list URLs]。啟用說話者辨識並使用 en-US 地區設定。
使用 Azure AI Transcription 技能設定即時音訊串流的即時轉錄。設定為英文地區設定。
使用 Azure AI Transcription 技能轉錄影片音訊並產生帶有時間戳記的 SRT 字幕檔案。影片位於 https://example.com/presentation.mp4。
最佳實務
- 轉錄多位說話者音訊時啟用說話者辨識以識別每位說話者
- 對於超過 1 分鐘的檔案使用批次轉錄以最佳化成本和可靠性
- 指定地區設定參數以針對已知語言提高轉錄精準度
避免
- 使用 DefaultAzureCredential - 此用戶端僅支援訂用金鑰驗證
- 在擷取結果前未檢查轉錄作業狀態即處理音訊
- 未處理即時串流的轉錄工作階段清理
常見問題
支援哪些驗證方法?
我可以直接轉錄本機音訊檔案嗎?
什麼是說話者辨識?
如何提供時間戳記?
支援哪些音訊格式?
我可以將其用於多語言轉錄嗎?
開發者詳情
作者
sickn33授權
MIT
儲存庫
https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-transcription-py引用
main
檔案結構
📄 SKILL.md