文档
返回首页
返回首页

🎞️ 音视频文件转写

音视频转写模式(离线模式)专为处理现有的录音、视频文件而设计。所有处理均在本地完成,确保您的商业隐私与数据安全。

最后更新:2026-04-21 · 文档语言:简体中文

🚀 快速开启

  1. 导入文件:直接将音视频文件拖入软件窗口,或点击中央的“选择文件”。
  2. 选择模式、模型:界面右侧选择需要的处理方式
  3. 即刻开始:点击下方的开始按钮,您可以实时看到处理进度(初始化 -> 预处理 -> 分段 -> 识别)。

1. 音频格式与预处理

Owl Meeting 具备极强的文件兼容性,但在开始前了解以下细节可以显著提升准确率:

2. 识别模式与分段

您可以根据文件内容的复杂程度灵活组合识别策略:

3. 测试模式

预览设置项识别效果。

4. 专属设置与微调

离线设置面板中,VAD 分段参数(语音判定阈值、最小静音/语音/最大语音时间、边缘填充)与实时识别相同,详见实时转写文档。以下是文件转写专属的配置项:

说话人分离与标记

当分段方式选择"说话人"时,以下参数决定分离质量:

分段进阶配置

模型特定配置

系统服务

5. 更高效的后处理

识别完成后,您可以利用内置工具直接生成高质量文稿:

6. 极致性能表现

得益于深度优化的本地推理引擎,即便在普通办公电脑的 CPU 上,Owl Meeting 也能跑出极速:

7. 常见问题与技巧

提示: 对于多通道视频文件,建议利用内置工具先提取/转换为单声道音频,以获得最精准的识别体验。