基于本地 AI 技术

专业的语音识别工具

支持实时录音识别和音视频文件转写,支持说话人分离、AI智能处理。

CPU极速运行
100% 隐私保护
完全离线

专为高效办公打造

智能识别

可以为不同说话人指定专属识别模型,系统自动切换,大幅提升识别准确率。

  • 基于声纹匹配最优模型
  • 大幅减少后期校对工作

完善的管理

历史记录管理、声纹库管理、识别结果一目了然,随时回溯查阅。

  • 声纹库持久化存储
  • 历史记录快速检索

强大的编辑功能

自定义词库自动纠错,支持批量删除与替换,AI纠错功能

  • 词库支持文本替换、拼音替换、删除指定词语
  • 点击文本直接跳转播放对应音频位置,边听边改
CPU 极速运行

无需GPU,
CPU模式同样飞快

极致性能

基于多款高效ASR模型构建,CPU模式下转写30min音频仅需1min *

告别繁琐的使用方式

一键安装,一键下载模型,图形化界面

隐私完全可控

所有数据本地处理,无需联网,敏感信息不外泄。

* 数据基于 i5-11400H 计算
在线
离线
历史
声纹库
词典
AI
2speakers.wav
00:00:00 / 00:00:51
5段 | 2人 全部说话人 ▾
搜索
小白 00:00:00 - 00:00:23

嗯,那么今天我们就简单的进行一下新生招聘的讨论吧...

小北 00:00:24 - 00:00:34

嗯,地点的话我们现在可以有三个选择...

小白 00:00:34 - 00:00:40

操场的话,这段时间太热了,我怕人流量有点少

小北 00:00:41 - 00:00:50

确实,那考虑室内体育馆怎么样?

Local LLM (Ollama)

深度集成本地大模型,
不止于"转录"

轻松上手

支持一键启动与可视化模型管理,让复杂的大模型变得简单易用

专业级 AI 模板

预置翻译、总结、纠错等模板,让后期工作事半功倍

无限 Prompt 扩展

支持自定义 Prompt 模板,按需定制你的专属 AI 助手

在线
离线
历史
声纹库
词典
AI
5段 | 2人
原文 翻译 纠错 定制
2speakers.wav
00:00:00 / 00:00:51
小白 00:00:00 - 00:00:23

嗯,那么今天我们就简单的进行一下新生招聘的讨论吧...

Well, then we can discuss the recruitment of new graduates today...

小北 00:00:24 - 00:00:34

嗯,地点的话我们现在可以有三个选择...

Well, the location options we have now are three choices...

小白 00:00:35 - 00:00:45

我觉得我们可以把重点放在计算机学院那边...

I think we can focus on the Computer Science College...

FAQ

是否需要联网?

不需要。模型推理、数据存储均在本地进行。

是否必须使用GPU?

不是,内置语音转文本模型均作了CPU推理优化,即便是10年前的CPU处理30min分钟音频也只需要3min。利用ollama部署大模型时,GPU越好就能使用更高级的模型。

我可以同时录制麦克风和系统声音吗?

可以,支持同时识别双路。

支持的语言?准确率如何?

普通话(97%)、中文方言(90%)、英语(95%)、韩语、日语以及意大利语(97%)、西班牙语(96%)、葡萄牙语(95%)、德语(95%)、法语(95%)、俄语(94%)、乌克兰语(93%)、波兰语(93%)、荷兰语(93%)等25种欧洲语言

是否支持编辑功能?

拥有强大的编辑能力,支持自定义词典的自动处理;支持点击识别结果自动播放音频的边听边改模式;支持批量修改和删除并自动更新词典。

支持的格式有哪些?

支持MP3, WAV, FLAC, AAC, M4A, OGG, AIFF, ALAC, CAF, PCM, ADPCM, WebM,等主流的音频格式,视频或者多声道音频可以通过内置工具进行转换后进行识别。

是否可以免费使用?

使用软件有可能触发激活码。当然如果你有任何理由,可以在问题反馈中说明,并留下邮箱。

跨平台支持,准备就绪

Windows

支持 Win 10及以上系统。

立即下载

macOS

适配 Intel 与 Apple Silicon,极致能效比。

敬请期待