文档
返回首页
返回首页

实时会议识别

实时模式可用于会议、讲座、网络直播或视频通话等场景。它不仅能同步记录文字,还能叠加 AI 翻译、纠错等处理,让您在会议进行中就获得高质量的文字记录。

最后更新:2026-04-21 · 文档语言:简体中文

快速开启

  1. 选择声源:在侧边栏选择"麦克风"、"系统"或"双路"。
  2. 选择模型:根据语种选择合适的识别模型。
  3. 选择模式:根据需要选择合适的模式
  4. 配置 AI(可选):如需实时翻译等功能,在下方选择 AI 任务并启动。
  5. 点击开始:点击"开始录音"按钮,即刻开启 AI 识别。

1. 音频输入源

根据您的应用场景,Owl Meeting 提供了三种灵活的方案:

2. 识别预处理

在声音送入识别引擎之前,您可以开启以下选项来优化质量:

3. 三种交互模式:适配您的工作流

除了在软件主界面查看文字,您还可以选择更高效的展现方式:

4. 专属设置与微调

如果在使用中遇到不顺手的地方,通常可以通过以下参数解决:

场景 调节建议
我明明说话了,但是识别结果中会丢句首或句尾。 降低[语音判定阈值]。调低它可以让软件变灵敏。
每次识别都识别出一大段话,输出结果太慢,读起来费劲。 降低[最小静音时间],让模型更快地分段。
有些很短的句子(比如:"好的"、"嗯嗯"),识别不出来。 降低[最小语音时间]。
字幕一次蹦出来一长串,读不过来;或低延迟模式反应越来越慢。 降低[最大语音时长]。通过限制单次处理的时长,尽快输出结果。使用模型2或模型4时适当调低此值,可显著提升响应速度。

5. 常见问题与技巧

隐私承诺: Owl Meeting 的所有实时识别均在本地完成,处理过程完全不需要联网。您的会议声音和文字记录永远留在您的电脑上。