Azure AI Python 语音转录

低风险

作者 @sickn33已验证来源

4.3571 次安装v1.0.0更新于 2026年5月25日

使用方式

在 Claude Code 中运行以下命令

第一步：添加 Marketplace

/plugin marketplace add sickn33/antigravity-awesome-skills

第二步：安装插件

/plugin install antigravity-awesome-skills@antigravity-awesome-skills

关于

适用于 Python 的 Azure AI 转录 SDK。用于实时和批量语音转文字，支持多语言和自定义模型。

name: azure-ai-transcription-py description: Azure AI 转录 SDK for Python。用于带时间戳和说话人分离的实时和批量语音转文字。 risk: unknown source: community date_added: '2026-02-27'

Azure AI 转录 SDK for Python

用于 Azure AI 转录（语音转文字）的客户端库，支持实时和批量转录。

安装

pip install azure-ai-transcription

环境变量

TRANSCRIPTION_ENDPOINT=https://<resource>.cognitiveservices.azure.com
TRANSCRIPTION_KEY=<your-key>

认证

使用订阅密钥认证（此客户端不支持 DefaultAzureCredential）：

import os
from azure.ai.transcription import TranscriptionClient

client = TranscriptionClient(
    endpoint=os.environ["TRANSCRIPTION_ENDPOINT"],
    credential=os.environ["TRANSCRIPTION_KEY"]
)

转录（批量）

job = client.begin_transcription(
    name="meeting-transcription",
    locale="en-US",
    content_urls=["https://<storage>/audio.wav"],
    diarization_enabled=True
)
result = job.result()
print(result.status)

转录（实时）

stream = client.begin_stream_transcription(locale="en-US")
stream.send_audio_file("audio.wav")
for event in stream:
    print(event.text)

最佳实践

启用说话人分离 当存在多个说话人时
使用批量转录 处理存储在 Blob 存储中的长文件
捕获时间戳 用于字幕生成
指定语言 以提高识别准确性
处理流式背压 用于实时转录
完成后关闭转录会话

适用场景

此技能适用于执行概述中描述的工作流或操作。

限制

仅在任务明确匹配上述范围时使用此技能。
不要将输出视为环境特定验证、测试或专家审查的替代品。
如果缺少所需输入、权限、安全边界或成功标准，请停下来要求澄清。

兼容工具

Claude CodeCursor

Azure AI Python 语音转录

关于

name: azure-ai-transcription-py description: Azure AI 转录 SDK for Python。用于带时间戳和说话人分离的实时和批量语音转文字。 risk: unknown source: community date_added: '2026-02-27'

Azure AI 转录 SDK for Python

安装

环境变量

认证

转录（批量）

转录（实时）

最佳实践

适用场景

限制

兼容工具

标签

相关推荐

RAG系统工程师

批量重构编排

Docx 文档处理

Azure AI Agents Java SDK

Azure Search 文档搜索

Azure AI Agent框架