文档
返回首页
返回首页

声纹与说话人管理

声纹库是 Owl Meeting 实现"知道谁在说话"的核心功能。通过预先录入每个人的声音样本,系统在文件转写时可以自动识别并标注发言人姓名,还能为不同的人指定最合适的识别模型。

最后更新:2026-04-21 · 文档语言:简体中文

1. 新增说话人

  1. 进入左侧工具栏的 [声纹库]
  2. 点击 [添加人员],填写姓名(必填)和备注(可选)。
  3. 为该说话人 指定识别模型:当开启文件转写中的 [智能模式] 时,系统会自动使用此处指定的模型来识别该说话人的语音。
  4. 声纹库管理界面 声纹库管理界面

2. 添加声纹样本

  1. 选中一个说话人,点击 [添加音频]
  2. 选择一段包含该说话人清晰人声的音频文件。
  3. 在裁剪窗口中设置开始/结束时间,可点击试听确认。
  4. 选择 [声纹语言] :中文样本选 [中文],英文样本选 [英文]。其他语言可根据语系选择最接近的一个。
  5. 点击保存,系统会自动提取声纹特征并关联到该说话人。
  6. 声纹样本添加与裁剪 声纹样本添加与裁剪

样本采集最佳实践

3. 日常维护

4. 声纹库如何在转写中生效

声纹库主要在 离线文件转写 中发挥作用。要让转写结果自动显示说话人姓名,需要同时满足以下条件:

  1. 分段方式选择 [说话人]
  2. 开启 [身份标记] 开关。
  3. 文件转写设置中的 [声纹语言] 与添加样本时选择的语言一致。

满足以上条件后,识别结果中的说话人标签将自动替换为声纹库中录入的真实姓名。

5. 常见问题排查

建议: 建库时为每个常见参会人员添加 1~2 段清晰的人声样本。声纹库建好后,后续所有文件转写都能自动识别身份,无需重复配置。