是否需要联网?
不需要。模型推理、数据存储均在本地进行。
可以为不同说话人指定专属识别模型,系统自动切换,大幅提升识别准确率。
历史记录管理、声纹库管理、识别结果一目了然,随时回溯查阅。
自定义词库自动纠错,支持批量删除与替换,AI纠错功能
基于多款高效ASR模型构建,CPU模式下转写30min音频仅需1min *
一键安装,一键下载模型,图形化界面
所有数据本地处理,无需联网,敏感信息不外泄。
嗯,那么今天我们就简单的进行一下新生招聘的讨论吧...
嗯,地点的话我们现在可以有三个选择...
操场的话,这段时间太热了,我怕人流量有点少
确实,那考虑室内体育馆怎么样?
支持一键启动与可视化模型管理,让复杂的大模型变得简单易用
预置翻译、总结、纠错等模板,让后期工作事半功倍
支持自定义 Prompt 模板,按需定制你的专属 AI 助手
嗯,那么今天我们就简单的进行一下新生招聘的讨论吧...
Well, then we can discuss the recruitment of new graduates today...
嗯,地点的话我们现在可以有三个选择...
Well, the location options we have now are three choices...
我觉得我们可以把重点放在计算机学院那边...
I think we can focus on the Computer Science College...
不需要。模型推理、数据存储均在本地进行。
不是,内置语音转文本模型均作了CPU推理优化,即便是10年前的CPU处理30min分钟音频也只需要3min。利用ollama部署大模型时,GPU越好就能使用更高级的模型。
可以,支持同时识别双路。
普通话(97%)、中文方言(90%)、英语(95%)、韩语、日语以及意大利语(97%)、西班牙语(96%)、葡萄牙语(95%)、德语(95%)、法语(95%)、俄语(94%)、乌克兰语(93%)、波兰语(93%)、荷兰语(93%)等25种欧洲语言
拥有强大的编辑能力,支持自定义词典的自动处理;支持点击识别结果自动播放音频的边听边改模式;支持批量修改和删除并自动更新词典。
支持MP3, WAV, FLAC, AAC, M4A, OGG, AIFF, ALAC, CAF, PCM, ADPCM, WebM,等主流的音频格式,视频或者多声道音频可以通过内置工具进行转换后进行识别。
使用软件有可能触发激活码。当然如果你有任何理由,可以在问题反馈中说明,并留下邮箱。