ASR语音识别配置
配置视频语音转文字的引擎和参数
ASR语音识别模型在 系统配置 → 大模型 中统一管理。请先在大模型配置中添加支持语音识别的模型(如 OpenAI Whisper),然后在此处选择绑定。
识别参数
配置语音识别的语言和精度参数
高级选项
自动为识别结果添加标点符号
为每段文字标注精确的时间戳
识别并区分不同说话人(适用于多人直播)
注意:ASR服务会产生额外的API调用费用。OpenAI Whisper约$0.006/分钟, 阿里云语音识别约¥0.01/15秒。建议根据视频量选择合适的服务商。