
关于
适用于 Python 的 Azure AI 转录 SDK。用于实时和批量语音转文字,支持多语言和自定义模型。
name: azure-ai-transcription-py description: Azure AI 转录 SDK for Python。用于带时间戳和说话人分离的实时和批量语音转文字。 risk: unknown source: community date_added: '2026-02-27'
Azure AI 转录 SDK for Python
用于 Azure AI 转录(语音转文字)的客户端库,支持实时和批量转录。
安装
pip install azure-ai-transcription
环境变量
TRANSCRIPTION_ENDPOINT=https://<resource>.cognitiveservices.azure.com
TRANSCRIPTION_KEY=<your-key>
认证
使用订阅密钥认证(此客户端不支持 DefaultAzureCredential):
import os
from azure.ai.transcription import TranscriptionClient
client = TranscriptionClient(
endpoint=os.environ["TRANSCRIPTION_ENDPOINT"],
credential=os.environ["TRANSCRIPTION_KEY"]
)
转录(批量)
job = client.begin_transcription(
name="meeting-transcription",
locale="en-US",
content_urls=["https://<storage>/audio.wav"],
diarization_enabled=True
)
result = job.result()
print(result.status)
转录(实时)
stream = client.begin_stream_transcription(locale="en-US")
stream.send_audio_file("audio.wav")
for event in stream:
print(event.text)
最佳实践
- 启用说话人分离 当存在多个说话人时
- 使用批量转录 处理存储在 Blob 存储中的长文件
- 捕获时间戳 用于字幕生成
- 指定语言 以提高识别准确性
- 处理流式背压 用于实时转录
- 完成后关闭转录会话
适用场景
此技能适用于执行概述中描述的工作流或操作。
限制
- 仅在任务明确匹配上述范围时使用此技能。
- 不要将输出视为环境特定验证、测试或专家审查的替代品。
- 如果缺少所需输入、权限、安全边界或成功标准,请停下来要求澄清。
兼容工具
Claude CodeCursor
标签
AI与机器学习