直播切片 - 应用配置

ASR语音识别配置

配置视频语音转文字的引擎和参数

ASR语音识别模型在 系统配置 → 大模型 中统一管理。请先在大模型配置中添加支持语音识别的模型(如 OpenAI Whisper),然后在此处选择绑定。
选择ASR模型
从系统已配置的大模型中选择用于语音识别的模型

暂无可用模型

请先在系统配置中添加大模型

识别参数
配置语音识别的语言和精度参数
高级选项

自动为识别结果添加标点符号

为每段文字标注精确的时间戳

识别并区分不同说话人(适用于多人直播)

注意:ASR服务会产生额外的API调用费用。OpenAI Whisper约$0.006/分钟, 阿里云语音识别约¥0.01/15秒。建议根据视频量选择合适的服务商。