专业词库优化
语音识别模型有时会把专业术语、人名或行业用语识别成同音错字。通过词库功能,您可以建立自动纠错规则,让系统在识别完成后自动修正这些已知错误——用得越久,结果越准。
1. 三种纠错规则
在左侧工具栏进入 "词典" 页面,您可以管理以下三种规则:
词典规则管理界面
删除规则
将指定词语从识别结果中彻底删除。适合过滤口头禅和语气词。
- 示例:添加"嗯"、"啊"、"这个"、"那个"等,识别结果中这些词会被自动清除。
文本替换
直接将识别错误的文字替换为正确的文字。适合修正固定的错别字。
- 示例:"泳磁体" → "永磁体"、"弓头安装" → "工头安装"
拼音替换(仅中文)
基于拼音进行纠错。当模型能正确听出读音但输出了错误的汉字时,这是最有效的修正方式。
- 输入目标词的汉字,系统会自动生成对应拼音。
- 示例:输入"永磁",系统生成
yong3ci2,之后凡是读音匹配的错字(如"泳磁"、"勇磁")都会被自动修正。 - 也支持人名纠错:输入"张伟"→
zhang1wei3,避免被识别为"章伟"、"张维"等。
2. 智能抽取词汇
如果您有一份正确的参考文本(如会议议程、产品手册),可以让系统自动提取其中的专业词汇:
- 在词典页面点击 "智能提取词汇"。
- 粘贴一段参考文本到输入框。
- 选择提取方式(专有词 / 高频词汇 / 发现新词)和数量。
- 点击 "开始分析",系统会列出候选词汇。
- 审核列表,删除不需要的词,确认后一键导入词库。
智能抽取词汇界面
此功能特别适合在开始一个新的行业项目前,快速建立该领域的专业词库。
3. 批量导入拼音词表
如果您已有大量需要纠正的词汇,可以使用批量导入功能,一次性将拼音词表导入词库,省去逐条添加的麻烦。
4. 最省事的维护方式
不必专门来词典页面添加规则。在 历史详情 中做批量替换或删除时,勾选 "同步词库",本次修改就会自动沉淀为词典规则,下次遇到相同错误时系统将自动修正。
使用建议: 优先使用"拼音替换"来修正中文专业术语,它比文本替换覆盖面更广——一条拼音规则可以纠正所有同音错字。