Does Owl Meeting require internet?

No. Model inference and data storage are both performed locally.

Not required. The built-in speech-to-text models are optimized for CPU inference. Even a 10-year-old CPU can process 30 minutes of audio in about 3 minutes. With Ollama for larger models, better GPUs enable more advanced models.

Can I record microphone and system audio at the same time?

Yes. Dual-channel simultaneous recognition is supported.

Which languages are supported and how accurate is it?

Mandarin (97%), Chinese dialects (90%), English (95%), Korean, Japanese, Italian (97%), Spanish (96%), Portuguese (95%), German (95%), French (95%), Russian (94%), Ukrainian (93%), Polish (93%), Dutch (93%), plus 25 other European languages.

Does it support editing features?

Yes. It provides powerful editing features, including automatic custom-dictionary processing, click-to-play listen-and-edit mode, and batch modify/delete with automatic dictionary updates.

What formats are supported?

Supports major audio formats such as MP3, WAV, FLAC, AAC, M4A, OGG, AIFF, ALAC, CAF, PCM, ADPCM, and WebM. Video or multi-channel audio can be converted with built-in tools before recognition.

Is it available for free?

Using the software may trigger an activation code requirement. However, if you have any reason to request free access, you can explain it in the feedback section and leave your email.

Owl Meeting - Herramienta Profesional de Reconocimiento de Voz

Herramientas para la Eficiencia

Reconocimiento Inteligente

Asigne modelos de reconocimiento dedicados a diferentes hablantes con cambio automático para mayor precisión.

Modelo óptimo basado en huella vocal
Reducción significativa del trabajo de post-edición

Gestión Completa

Gestiona el historial, la biblioteca de huellas vocales y los resultados de reconocimiento.

Almacenamiento persistente de huellas vocales
Búsqueda rápida en historial

Potentes Funciones de Edición

Diccionario personalizado con auto-corrección, edición por lotes, corrección IA

Reemplazo de texto, reemplazo de pinyin y eliminación de palabras en el diccionario
Haga clic en el texto para saltar a la posición de audio, escuche mientras edita

Rápido en CPU

Sin GPU Necesaria,
Rápido en CPU

Rendimiento Máximo

Basado en múltiples modelos ASR eficientes, transcribe 30min de audio en solo 1min en CPU *

Adiós a la Complejidad

Instalación con un clic, descarga de modelos con un clic, interfaz gráfica

Control Total de Privacidad

Todos los datos procesados localmente, sin internet, la información sensible nunca se filtra.

* Datos basados en i5-11400H

En línea

Offline

Historial

5 seg. | 2 hablantes Todos los hablantes ▾

Buscar

小白 00:00:00 - 00:00:23

嗯，那么今天我们就简单的进行一下新生招聘的讨论吧...

小北 00:00:24 - 00:00:34

嗯，地点的话我们现在可以有三个选择...

小白 00:00:34 - 00:00:40

操场的话，这段时间太热了，我怕人流量有点少

小北 00:00:41 - 00:00:50

确实，那考虑室内体育馆怎么样？

Local LLM (Ollama)

Integración Profunda de LLM Local,
Más allá de la "Transcripción"

Fácil de Usar

Permite iniciar con un clic y gestionar modelos de forma intuitiva, para que incluso los modelos grandes y complejos sean fáciles de usar

Plantillas IA Profesionales

Pre-configurado para traducción con un clic, resumen y corrección

Prompts Personalizables Extensibles

Adapte la inteligencia IA a su flujo de trabajo con prompts personalizados

En línea

Offline

Historial

Huellas

Dicc.

AI

5 seg. | 2 hablantes

Original Trad. Corr. Person.

2speakers.wav

00:00:00 / 00:00:51

小白 00:00:00 - 00:00:23

嗯，那么今天我们就简单的进行一下新生招聘的讨论吧...

Well, then we can discuss the recruitment of new graduates today...

小北 00:00:24 - 00:00:34

嗯，地点的话我们现在可以有三个选择...

Well, the location options we have now are three choices...

小白 00:00:35 - 00:00:45

我觉得我们可以把重点放在计算机学院那边...

I think we can focus on the Computer Science College...

Preguntas frecuentes

¿Se requiere internet?

No. La inferencia del modelo y el almacenamiento de datos se realizan localmente.

¿Es obligatorio usar GPU?

No es obligatorio. Los modelos integrados de voz a texto están optimizados para inferencia en CPU. Incluso una CPU de hace 10 años puede procesar 30 minutos de audio en unos 3 minutos. Al desplegar modelos grandes con Ollama, una GPU mejor permite usar modelos más avanzados.

¿Puedo grabar al mismo tiempo el micrófono y el audio del sistema?

Sí. Se admite el reconocimiento simultáneo de dos canales.

¿Qué idiomas son compatibles y cuál es la precisión?

Mandarín (97%), dialectos chinos (90%), inglés (95%), coreano, japonés, italiano (97%), español (96%), portugués (95%), alemán (95%), francés (95%), ruso (94%), ucraniano (93%), polaco (93%), neerlandés (93%) y otros 25 idiomas europeos.

¿Admite funciones de edición?

Sí. Ofrece potentes funciones de edición: procesamiento automático con diccionario personalizado; modo escuchar-y-editar con reproducción automática al hacer clic en el resultado; modificación y eliminación por lotes con actualización automática del diccionario.

¿Qué formatos son compatibles?

Admite formatos de audio principales como MP3, WAV, FLAC, AAC, M4A, OGG, AIFF, ALAC, CAF, PCM, ADPCM y WebM. El video o el audio multicanal pueden convertirse con las herramientas integradas antes del reconocimiento.

¿Está disponible de forma gratuita?

El uso del software puede requerir un código de activación. Sin embargo, si tiene alguna razón para solicitar acceso gratuito, puede explicarla en la sección de comentarios y dejar su correo electrónico.

Listo para múltiples plataformas

Windows

Compatible con Win 10 y superior.

Descargar Ahora

macOS

Optimizado para Intel y Apple Silicon, máxima eficiencia.

Próximamente

Reconocimiento de VozProfesional