直播切片 - 应用配置

ASR语音识别配置

配置视频语音转文字的引擎和参数

ASR语音识别模型在系统配置 → 大模型中统一管理。请先在大模型配置中添加支持语音识别的模型（如 OpenAI Whisper），然后在此处选择绑定。

选择ASR模型

从系统已配置的大模型中选择用于语音识别的模型

暂无可用模型

请先在系统配置中添加大模型

识别参数

配置语音识别的语言和精度参数

识别语言

高级选项

自动标点

自动为识别结果添加标点符号

时间戳

为每段文字标注精确的时间戳

说话人分离

识别并区分不同说话人（适用于多人直播）

注意：ASR服务会产生额外的API调用费用。OpenAI Whisper约$0.006/分钟，阿里云语音识别约¥0.01/15秒。建议根据视频量选择合适的服务商。