🎙️ 实时会议识别
实时模式适用于正在进行的会议、讲座或在线视频通话。
1. 音频输入源
Owl Meeting 提供多样化的声源采集方案,支持针对不同办公场景的灵活切换:
- 麦克风:专注于采集您本地的发言内容,适用于线下讲座、个人录音或嘈杂环境下的特写拾音。
- 系统声音:直接捕获电脑内部发出的各种音频,适用于转写网页视频、播客或仅听取远程会议。
- 双路模式:同时采集麦克风和系统声音。这是远程会议(如腾讯会议、Zoom、飞书)的推荐配置,可完整记录对话双方的语音内容。
2. 低延迟模式
针对高实效性需求的办公场景,您可以开启“低延迟模式”:
- 流式反馈:AI 引擎将以极高的频率输出识别过程中的动态草稿,显著降低体感延迟。
- 快速修正:在您说话的同时,文字会根据上下文语义不断进行自动修正,提供“所听即所得”的转写体验。
3. 字幕模式与语音输入
识别结果不仅限于软件界面,更可以通过多种交互方式融入您的工作流:
- 字幕模式:开启后将出现一个透明的桌面悬浮窗。当您在观看在线直播、远程视频或视频教程时,可以实时阅读转写出的字幕。
- 语音输入:这是一项效率工具。开启后,识别出的文字将像输入法一样,直接“打”入您当前鼠标光标所在的任意文字焦点(如 Word、邮件、聊天窗口等)。
4. AI 任务
在实时转写开始前,您可以预设自动化的 AI 处理链路:
- 实时:AI 任务(如翻译、总结、润色等),伴随转写过程实时执行。
5. 实时识别中丢片段怎么处理
降低分段设置中的[语音判定阈值]
6. 字幕模式时,每个片段文本太长怎么处理
降低分段设置中的[最大语音时间]
7. 低延迟模式时,响应时间越来越慢怎么处理
降低分段设置中的[最大语音时间]
8. 我想让识别结果直接显示繁体中文怎么设置
在[设置]中,将[简繁转换]设置为[繁体中文]
提示: 极低的CPU和内存占用,让您在进行实时转写的同时,可以流畅地进行其他工作。