技能 Azure AI Transcription SDK for Python

📦

Azure AI Transcription SDK for Python

Name: Azure AI Transcription SDK for Python
Author: sickn33

安全

使用 Azure AI 轉錄音訊

需要對音訊檔案或即時串流進行精準的語音轉文字轉錄。此技能提供 Azure AI Transcription 的 Python SDK 整合，包含批次處理和串流支援。

支援: Claude Codex Code(CC)

📊 69 充足

下載技能 ZIP

在 Claude 中上傳

前往設定 → 功能 → 技能 → 上傳技能

開啟並開始使用

測試它

正在使用「Azure AI Transcription SDK for Python」。 Transcribe audio file at https://storage.example.com/meeting.wav

預期結果:

轉錄作業已提交。作業 ID：abc123。狀態：進行中。完成後，結果將包含帶有時間戳記的文字區段，以及如果啟用說話者辨識，則會包含說話者標籤。

正在使用「Azure AI Transcription SDK for Python」。 Set up real-time transcription for English audio

預期結果:

串流轉錄工作階段已初始化。地區設定：en-US。當音訊處理時，串流將輸出轉錄的文字事件。

安全審計

安全

v1 • 2/24/2026

This is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.

已掃描檔案

分析行數

發現項

審計總數

未發現安全問題

審計者: claude

品質評分

架構

100

可維護性

內容

社群

100

安全

規範符合性

你能建構什麼

會議轉錄

轉錄已錄製的會議或電話會議並識別說話者

媒體內容字幕

從音軌產生影片內容的時間戳記字幕

客服中心分析

將客戶電話錄音轉換為文字以進行分析和品質保證

試試這些提示

基本批次轉錄

使用 Azure AI Transcription 技能轉錄位於 URL https://example.com/meeting.wav 的音訊檔案，並啟用說話者辨識。

多檔案轉錄

使用 Azure AI Transcription 技能轉錄以下 URL 的多個音訊檔案：[list URLs]。啟用說話者辨識並使用 en-US 地區設定。

即時串流轉錄

使用 Azure AI Transcription 技能設定即時音訊串流的即時轉錄。設定為英文地區設定。

字幕產生

使用 Azure AI Transcription 技能轉錄影片音訊並產生帶有時間戳記的 SRT 字幕檔案。影片位於 https://example.com/presentation.mp4。

最佳實務

轉錄多位說話者音訊時啟用說話者辨識以識別每位說話者
對於超過 1 分鐘的檔案使用批次轉錄以最佳化成本和可靠性
指定地區設定參數以針對已知語言提高轉錄精準度

避免

使用 DefaultAzureCredential - 此用戶端僅支援訂用金鑰驗證
在擷取結果前未檢查轉錄作業狀態即處理音訊
未處理即時串流的轉錄工作階段清理

常見問題

支援哪些驗證方法？

此 SDK 僅支援透過 TRANSCRIPTION_KEY 環境變數進行的訂用金鑰驗證。不支援 DefaultAzureCredential。

我可以直接轉錄本機音訊檔案嗎？

對於批次轉錄，音訊檔案必須可透過 HTTPS URL 存取。請考慮先上傳至 Azure Blob Storage。即時轉錄可以接受本機音訊檔案。

什麼是說話者辨識？

說話者辨識可識別並標記音訊中的不同說話者。啟用 diarization_enabled=True 以在轉錄輸出中取得說話者標籤。

如何提供時間戳記？

轉錄結果包含每個單字或區段的偏移時間戳記，可啟用字幕產生和同步音訊文字應用程式。

支援哪些音訊格式？

Azure AI Transcription 支援常見的音訊格式，包括 WAV、MP3 和 FLAC。請查看 Azure 文件以取得支援格式的完整清單。

我可以將其用於多語言轉錄嗎？

是的，請在啟動轉錄時指定地區設定參數。支援的地區設定包括 en-US、en-GB、es-ES、fr-FR、de-DE 等許多選項。

開發者詳情

作者

sickn33

授權

MIT

儲存庫

https://github.com/sickn33/antigravity-awesome-skills/tree/main/skills/azure-ai-transcription-py

引用

main

檔案結構

📄 SKILL.md