文档
返回首页
返回首页

专业词库优化

语音识别模型有时会把专业术语、人名或行业用语识别成同音错字。通过词库功能,您可以建立自动纠错规则,让系统在识别完成后自动修正这些已知错误——用得越久,结果越准。

最后更新:2026-04-21 · 文档语言:简体中文

1. 三种纠错规则

在左侧工具栏进入 "词典" 页面,您可以管理以下三种规则:

词典规则管理界面 词典规则管理界面

删除规则

将指定词语从识别结果中彻底删除。适合过滤口头禅和语气词。

文本替换

直接将识别错误的文字替换为正确的文字。适合修正固定的错别字。

拼音替换(仅中文)

基于拼音进行纠错。当模型能正确听出读音但输出了错误的汉字时,这是最有效的修正方式。

2. 智能抽取词汇

如果您有一份正确的参考文本(如会议议程、产品手册),可以让系统自动提取其中的专业词汇:

  1. 在词典页面点击 "智能提取词汇"
  2. 粘贴一段参考文本到输入框。
  3. 选择提取方式(专有词 / 高频词汇 / 发现新词)和数量。
  4. 点击 "开始分析",系统会列出候选词汇。
  5. 审核列表,删除不需要的词,确认后一键导入词库。
  6. 智能抽取词汇界面 智能抽取词汇界面

此功能特别适合在开始一个新的行业项目前,快速建立该领域的专业词库。

3. 批量导入拼音词表

如果您已有大量需要纠正的词汇,可以使用批量导入功能,一次性将拼音词表导入词库,省去逐条添加的麻烦。

4. 最省事的维护方式

不必专门来词典页面添加规则。在 历史详情 中做批量替换或删除时,勾选 "同步词库",本次修改就会自动沉淀为词典规则,下次遇到相同错误时系统将自动修正。

使用建议: 优先使用"拼音替换"来修正中文专业术语,它比文本替换覆盖面更广——一条拼音规则可以纠正所有同音错字。