¿Es necesario el acceso a internet para el primer uso?

Normalmente se requiere internet durante la fase de instalación inicial y descarga del modelo; una vez listos, el proceso de transcripción principal funciona totalmente sin conexión.

¿Qué modelo deberían descargar primero los principiantes?

Se recomienda empezar por modelos ligeros o de alta velocidad para priorizar la rapidez; cambie a modelos de alta precisión cuando requiera mayor exactitud.

¿La licencia de pago único limita el uso del dispositivo?

Según la documentación, la autorización sigue la cuenta de Microsoft y puede instalarse en varios dispositivos. Consulte las reglas de la Store para más detalles.

Inicio

Inicio rápido

Owl Meeting es una herramienta de productividad de voz para Windows que funciona al 100% de forma local. Todo el reconocimiento de voz y el procesamiento de IA se completan en su ordenador sin necesidad de conexión a internet, y los datos nunca se exportan. Siguiendo esta guía, podrá completar su primera transcripción en pocos minutos.

Última actualización: 21-04-2026 · Idioma: Español

1. Instalación y requisitos del sistema

Origen de la instalación: Busque "Owl Meeting" en la Microsoft Store para instalarlo y disfrutar de actualizaciones automáticas.
Dependencia de tiempo de ejecución: El motor de reconocimiento de voz requiere el soporte de Visual C++ Redistributable. Si aparece un aviso durante el primer inicio, descárguelo e instálelo según las instrucciones y reinicie el software.
Requisitos del sistema: Windows 10/11, arquitectura x64. No se requiere una GPU dedicada; la CPU de un ordenador de oficina normal es suficiente para un funcionamiento fluido.

2. Descarga de modelos

Tras el primer inicio, debe descargar los modelos de IA en la página "Configuración → Gestión de modelos". Una vez descargados, el software puede funcionar totalmente sin conexión:

Interfaz de gestión y descarga de modelos

Modelo	Descripción de la función	Velocidad
Modelo 1 (Recomendado)	Soporta chino, inglés, japonés y coreano. Extremadamente rápido, adecuado para la mayoría de los escenarios. Opción preferida para nuevos usuarios.	Velocidad Extrema
Modelo 2	Especializado en el reconocimiento de dialectos chinos. Debe usarse junto con el modelo de puntuación.	Normal
Modelo 3	Soporta inglés y 26 idiomas europeos (italiano, español, alemán, francés, etc.).	Velocidad Extrema
Modelo 4	Cobertura más amplia: mandarín, dialectos chinos, inglés, japonés, coreano, ruso, francés, alemán, árabe, etc., más de 30 idiomas.	Normal
Modelo de puntuación	Soporta la compleción de puntuación en chino e inglés. Puede activarse para corregir problemas de puntuación en los resultados.

3. Inicie rápidamente su primera transcripción

Owl Meeting ofrece dos modos de trabajo principales:

Transcripción en tiempo real (modo en línea)

Adecuado para reuniones en curso, conferencias o videollamadas:

Haga clic en "En línea" para entrar en la interfaz de transcripción en tiempo real.
Seleccione la fuente de sonido: Micrófono (reuniones presenciales), Sonido del sistema (webcasts/vídeos) o modo de doble canal (Tencent Meeting/Zoom, etc.).
Seleccione el modelo de reconocimiento; se recomienda el Modelo 1 para nuevos usuarios.
Haga clic en "Iniciar grabación" y el texto se mostrará en pantalla en tiempo real.

Para parámetros detallados y funciones avanzadas, consulte la documentación de Transcripción en tiempo real.

Transcripción de archivos (modo fuera de línea)

Adecuado para procesar archivos de audio o vídeo existentes:

Haga clic en "Fuera de línea" para entrar en la interfaz de transcripción de archivos.
Arrastre los archivos al área de la ventana o haga clic en "Seleccionar archivo". Soporta MP3, WAV, M4A, MP4, MKV y otros formatos habituales.
Seleccione el modelo y el método de segmentación a la derecha. Se recomienda Modelo 1 + Segmentación por intervalo de tiempo.
Haga clic en "Iniciar reconocimiento"; el progreso se mostrará en tiempo real.

Interfaz de operación de transcripción de archivos

Para parámetros detallados y funciones avanzadas, consulte la documentación de Transcripción de archivos.

4. Configuración recomendada para nuevos usuarios

Si es un usuario novel, la siguiente configuración le ayudará a empezar rápidamente:

Modelo de reconocimiento: Modelo 1 (Rápido, buen rendimiento general)
Método de segmentación: Intervalo de tiempo (autosegmentación VAD)
Modo de reconocimiento: Modo regular
Reducción de ruido: Desactivado para audio nítido, activado para entornos ruidosos

Funciones avanzadas como la separación de hablantes, el Reconocimiento de hablantes, el Diccionario personalizado y el Asistente de IA se pueden utilizar más adelante para optimizar los resultados gradualmente.

Consejo clave: Todos los motores de transcripción de Owl Meeting funcionan localmente; el procesamiento no depende en absoluto de internet. Sus grabaciones y transcripciones siempre permanecen en su ordenador.