Owl Meeting - 专业语音识别工具 | 声纹管理 · 智能模型切换

专为高效办公打造

智能识别

可以为不同说话人指定专属识别模型，系统自动切换，大幅提升识别准确率。

基于声纹匹配最优模型
大幅减少后期校对工作

完善的管理

历史记录管理、声纹库管理、识别结果一目了然，随时回溯查阅。

声纹库持久化存储
历史记录快速检索

强大的编辑功能

自定义词库自动纠错，支持批量删除与替换，AI纠错功能

词库支持文本替换、拼音替换、删除指定词语
点击文本直接跳转播放对应音频位置，边听边改

CPU 极速运行

无需GPU，
CPU模式同样飞快

极致性能

基于多款高效ASR模型构建，CPU模式下转写30min音频仅需1min *

告别繁琐的使用方式

一键安装，一键下载模型，图形化界面

隐私完全可控

所有数据本地处理，无需联网，敏感信息不外泄。

* 数据基于 i5-11400H 计算

在线

离线

历史

5段 | 2人全部说话人 ▾

搜索

小白 00:00:00 - 00:00:23

嗯，那么今天我们就简单的进行一下新生招聘的讨论吧...

小北 00:00:24 - 00:00:34

嗯，地点的话我们现在可以有三个选择...

小白 00:00:34 - 00:00:40

操场的话，这段时间太热了，我怕人流量有点少

小北 00:00:41 - 00:00:50

确实，那考虑室内体育馆怎么样？

多场景专业方案

商务会议

自动区分发言人，通过 AI 快速生成会议摘要，离线环境确保商业机密安全。

学术研究

支持高准确率转录长篇访谈、讲座，自定义词库精准识别专业术语。

内容创作

语音输入即时捕捉灵感；离线转写轻松生成播客、短视频字幕素材。

Local LLM (Ollama)

深度集成本地大模型，
不止于"转录"

轻松上手

支持一键启动与可视化模型管理，让复杂的大模型变得简单易用

专业级 AI 模板

预置翻译、总结、纠错等模板，让后期工作事半功倍

无限 Prompt 扩展

支持自定义 Prompt 模板，按需定制你的专属 AI 助手

在线

离线

历史

声纹库

词典

AI

5段 | 2人

原文翻译纠错定制

2speakers.wav

00:00:00 / 00:00:51

小白 00:00:00 - 00:00:23

嗯，那么今天我们就简单的进行一下新生招聘的讨论吧...

Well, then we can discuss the recruitment of new graduates today...

小北 00:00:24 - 00:00:34

嗯，地点的话我们现在可以有三个选择...

Well, the location options we have now are three choices...

小白 00:00:35 - 00:00:45

我觉得我们可以把重点放在计算机学院那边...

I think we can focus on the Computer Science College...

FAQ

是否需要联网？

不需要。模型推理、数据存储均在本地进行。

是否必须使用GPU？

不是，内置语音转文本模型均作了CPU推理优化，即便是10年前的CPU处理30min分钟音频也只需要3min。利用ollama部署大模型时，GPU越好就能使用更高级的模型。

我可以同时录制麦克风和系统声音吗？

可以，支持同时识别双路。

支持的语言？准确率如何？

普通话（97%）、中文方言（90%）、英语（95%）、韩语（94%）、日语（94%）阿拉伯语、以及意大利语（97%）、西班牙语（96%）、葡萄牙语（95%）、德语（95%）、法语（95%）、俄语（94%）、乌克兰语（93%）、波兰语（93%）、荷兰语（93%）等25种欧洲语言、印尼语、泰语、越南语、土耳其语、印地语、马来语、菲律宾语、波斯语、希腊语、马其顿语、罗马尼亚语

是否支持编辑功能？

拥有强大的编辑能力，支持自定义词典的自动处理；支持点击识别结果自动播放音频的边听边改模式；支持批量修改和删除并自动更新词典。

支持的格式有哪些？

支持MP3, WAV, FLAC, AAC, M4A, OGG, AIFF, ALAC, CAF, PCM, ADPCM, WebM,等主流的音频格式，视频或者多声道音频可以通过内置工具进行转换后进行识别。

是否可以免费使用？

使用软件有可能触发激活码。当然如果你有任何理由，可以在问题反馈中说明，并留下邮箱。

跨平台支持，准备就绪

Windows

支持 Win 10及以上系统。

立即下载

macOS

适配 Intel 与 Apple Silicon，极致能效比。

敬请期待

专业的语音识别工具