¿Qué hacer si faltan fragmentos durante el reconocimiento en directo?

Se recomienda bajar el [Voice Threshold] en los ajustes de segmentación para adaptarse a entornos más silenciosos o voz más pausada.

¿Cómo visualizar los resultados del reconocimiento directamente en chino tradicional?

En [Settings], establezca la opción [Chinese Conversion] en [Traditional Chinese] para la salida de texto tradicional en tiempo real.

Inicio

🎙️ Reconocimiento de reuniones en tiempo real

La modalidad en tiempo real es ideal para reuniones en curso, clases, transmisiones en directo o videollamadas. No solo registra el texto de forma sincrónica, sino que también ofrece funciones de procesamiento de IA.

Last Updated: 2026-04-21 · Idioma: Español

🚀 Inicio Rápido

Seleccionar Fuente: Elija [Microphone], [System] o [Dual] en la barra lateral.
Seleccionar Modelo: Elija el modelo de IA adecuado según el rendimiento de su hardware.
Configurar Modo: Elija entre [Low Latency] u otras preferencias de visualización.
Tareas de IA (Opcional): Habilite tareas como [Translate] o resúmenes en tiempo real.
Hacer clic en Start: Pulse el botón [Start] para iniciar inmediatamente la transcripción.

1. Fuentes de Entrada de Audio

Dependiendo del escenario, Owl Meeting proporciona tres esquemas flexibles:

[Microphone]: Captura el audio de sus dispositivos de entrada. Ideal para notas personales o reuniones físicas.
[System]: Captura directamente el audio interno del ordenador. Adecuado para transcribir vídeos o podcasts.
[Dual Mode]: Capturará simultáneamente su voz y la de los otros participantes. Úselo durante llamadas en Zoom, Teams o Slack.

Configuración de la fuente de audio en la barra lateral

2. Pre-procesamiento del Reconocimiento

Antes de enviar el audio al motor de reconocimiento, puede habilitar dos opciones para optimizar la calidad:

[Denoise]: Filtra el ruido ambiental para mejorar la claridad de la entrada inicial.
[Mixing]: Disponible tras habilitar la Reducción de Ruido, ayuda en entornos especialmente ruidosos.

3. Tres Modos de Interacción

Además de visualizar el texto en la aplicación principal, puede elegir métodos más eficientes:

[Low Latency]: Visualiza borradores de predicción en tiempo real mientras habla.
[Subtitle Window]: Abre una ventana flotante semitransparente para ver los subtítulos sobre otras aplicaciones.
Efecto de la ventana flotante de subtítulos
[Voice Input]: Transforma la voz en texto escrito directamente donde se encuentre el cursor.

4. Ajustes Exclusivos y Optimización

Ajuste estos parámetros para adaptarse a diferentes estilos de habla y entornos:

Escenario	Sugerencia de Ajuste
Omisión del inicio o final de las frases.	Reduzca el [Voice Threshold] para aumentar la sensibilidad.
Texto demasiado denso y segmentación lenta.	Reduzca el [Min Silence (s)].
Frases cortas (ej. "Vale") ignoradas.	Reduzca el [Min Speech (s)].
Subtítulos lentos o bloques demasiado grandes.	Reduzca el [Max Speech (s)] para acelerar la salida de resultados.

5. FAQ y Suggerencias

¿Dónde se guardan las grabaciones?
Los archivos de audio y los resultados se guardan localmente en la carpeta [Documents] de su PC, dentro del directorio del proyecto. Puede acceder a ellos a través de la pestaña [History].
¿Cómo visualizar los resultados directamente en chino tradicional?
Cambie [Chinese Conversion] a [Traditional Chinese] en [Settings].
¿Uso de CPU demasiado alto durante el reconocimiento?
Si usa el modo de [Low Latency], intente aumentar el [Partial Interval] (ej. 0.8s) para reducir la carga.

Promesa de Privacidad: Todas las transcripciones en tiempo real en Owl Meeting se generan localmente. El audio y el texto permanecen siempre en su ordenador.