技能 Azure AI Transcription SDK for Python
📦
Azure AI Transcription SDK for Python
安全
使用 Azure AI 转录音频
需要为音频文件或实时流提供准确的语音转文本转录服务。此技能提供 Azure AI 转录的 Python SDK 集成,支持批量处理和流式传输。
支持: Claude Codex Code(CC)
1
下载技能 ZIP
2
在 Claude 中上传
前往 设置 → 功能 → 技能 → 上传技能
3
开启并开始使用
测试它
正在使用“Azure AI Transcription SDK for Python”。 转录位于 https://storage.example.com/meeting.wav 的音频文件
预期结果:
转录作业已提交。作业 ID:abc123。状态:进行中。完成后,结果将包含带时间戳的文本片段,如果启用了说话人分离,还会有说话人标签。
正在使用“Azure AI Transcription SDK for Python”。 为英语音频设置实时转录
预期结果:
流式转录会话已初始化。区域设置:en-US。流将在处理音频时输出转录的文本事件。
安全审计
安全v1 • 2/24/2026
This is a prompt-only documentation skill containing only informational content about the Azure AI Transcription SDK. No executable code, scripts, or network calls are present. The skill provides usage examples for batch and real-time transcription. Risk score is 0/100.
0
已扫描文件
0
分析行数
0
发现项
1
审计总数
未发现安全问题
审计者: claude
质量评分
38
架构
100
可维护性
87
内容
50
社区
100
安全
83
规范符合性
你能构建什么
会议转录
转录录制的会议或电话会议,并识别说话人
媒体内容字幕
从音轨为视频内容生成带时间戳的字幕
呼叫中心分析
将客户通话录音转换为文本进行分析和质量保证
试试这些提示
基础批量转录
使用 Azure AI 转录技能对 URL 为 https://example.com/meeting.wav 的音频文件进行转录,并启用说话人分离。
多文件转录
使用 Azure AI 转录技能对这些 URL 的多个音频文件进行转录:[list URLs]。启用说话人分离并使用 en-US 区域设置。
实时流转录
使用 Azure AI 转录技能为实时音频流设置实时转录。配置为英语区域设置。
字幕生成
使用 Azure AI 转录技能转录视频音频并生成带时间戳的 SRT 字幕文件。视频位于 https://example.com/presentation.mp4。
最佳实践
- 转录多人音频时启用说话人分离,以识别每位说话人
- 对超过 1 分钟的文件使用批量转录以优化成本和可靠性
- 指定区域设置参数以提高已知语言的转录准确性
避免
- 使用 DefaultAzureCredential - 此客户端仅支持订阅密钥身份验证
- 在检索结果前不检查转录作业状态就处理音频
- 不为实时流处理转录会话清理
常见问题
支持哪些身份验证方法?
此 SDK 仅支持通过 TRANSCRIPTION_KEY 环境变量进行订阅密钥身份验证。不支持 DefaultAzureCredential。
我可以直接转录本地音频文件吗?
对于批量转录,音频文件必须可通过 HTTPS URL 访问。请考虑先上传到 Azure Blob 存储。实时转录可以接受本地音频文件。
什么是说话人分离?
说话人分离可识别和标记音频中的不同说话人。启用时设置 diarization=True 即可在转录输出中获取说话人标签。
如何提供时间戳?
转录结果包含每个词或片段的偏移时间戳,可用于字幕生成和音视频同步应用。
支持哪些音频格式?
Azure AI 转录支持常见的音频格式,包括 WAV、MP3 和 FLAC。请查看 Azure 文档获取支持的完整格式列表。
可以用于多语言转录吗?
可以,在启动转录时指定区域设置参数。支持 en-US、en-GB、es-ES、fr-FR、de-DE 等多种区域设置。