¿Se requiere internet?
No. La inferencia del modelo y el almacenamiento de datos se realizan localmente.
Asigne modelos de reconocimiento dedicados a diferentes hablantes con cambio automático para mayor precisión.
Gestiona el historial, la biblioteca de huellas vocales y los resultados de reconocimiento.
Diccionario personalizado con auto-corrección, edición por lotes, corrección IA
Basado en múltiples modelos ASR eficientes, transcribe 30min de audio en solo 1min en CPU *
Instalación con un clic, descarga de modelos con un clic, interfaz gráfica
Todos los datos procesados localmente, sin internet, la información sensible nunca se filtra.
嗯,那么今天我们就简单的进行一下新生招聘的讨论吧...
嗯,地点的话我们现在可以有三个选择...
操场的话,这段时间太热了,我怕人流量有点少
确实,那考虑室内体育馆怎么样?
Permite iniciar con un clic y gestionar modelos de forma intuitiva, para que incluso los modelos grandes y complejos sean fáciles de usar
Pre-configurado para traducción con un clic, resumen y corrección
Adapte la inteligencia IA a su flujo de trabajo con prompts personalizados
嗯,那么今天我们就简单的进行一下新生招聘的讨论吧...
Well, then we can discuss the recruitment of new graduates today...
嗯,地点的话我们现在可以有三个选择...
Well, the location options we have now are three choices...
我觉得我们可以把重点放在计算机学院那边...
I think we can focus on the Computer Science College...
No. La inferencia del modelo y el almacenamiento de datos se realizan localmente.
No es obligatorio. Los modelos integrados de voz a texto están optimizados para inferencia en CPU. Incluso una CPU de hace 10 años puede procesar 30 minutos de audio en unos 3 minutos. Al desplegar modelos grandes con Ollama, una GPU mejor permite usar modelos más avanzados.
Sí. Se admite el reconocimiento simultáneo de dos canales.
Mandarín (97%), dialectos chinos (90%), inglés (95%), coreano, japonés, italiano (97%), español (96%), portugués (95%), alemán (95%), francés (95%), ruso (94%), ucraniano (93%), polaco (93%), neerlandés (93%) y otros 25 idiomas europeos.
Sí. Ofrece potentes funciones de edición: procesamiento automático con diccionario personalizado; modo escuchar-y-editar con reproducción automática al hacer clic en el resultado; modificación y eliminación por lotes con actualización automática del diccionario.
Admite formatos de audio principales como MP3, WAV, FLAC, AAC, M4A, OGG, AIFF, ALAC, CAF, PCM, ADPCM y WebM. El video o el audio multicanal pueden convertirse con las herramientas integradas antes del reconocimiento.
El uso del software puede requerir un código de activación. Sin embargo, si tiene alguna razón para solicitar acceso gratuito, puede explicarla en la sección de comentarios y dejar su correo electrónico.