Início rápido
O Owl Meeting é uma ferramenta de produtividade de voz para Windows que funciona 100% localmente. Todo o reconhecimento de fala e processamento de IA são concluídos em seu computador, sem necessidade de conexão com a internet, e os dados nunca são exportados. Seguindo este guia, você poderá concluir sua primeira transcrição em poucos minutos.
1. Instalação e requisitos do sistema
- Origem da instalação: Pesquise por "Owl Meeting" na Microsoft Store para instalar e aproveitar as atualizações automáticas.
- Dependência de runtime: O mecanismo de reconhecimento de fala requer suporte do Visual C++ Redistributable. Se um aviso aparecer durante o primeiro lançamento, faça o download e instale-o conforme as instruções e reinicie o software.
- Requisitos do sistema: Windows 10/11, arquitetura x64. Não é necessária uma placa gráfica dedicada; a CPU de um computador de escritório normal é suficiente para uma operação suave.
2. Download do modelo
Após o primeiro lançamento, você precisa baixar os modelos de IA na página "Configurações → Gerenciamento de modelos". Uma vez baixados, o software pode funcionar totalmente [Offline]:
Interface de gerenciamento e download de modelos
| Modelo | Descrição da função | Velocidade |
|---|---|---|
| Modelo 1 (Recomendado) | Suporta chinês, inglês, japonês e coreano. Extremamente rápido, adequado para a maioria dos cenários. Escolha preferida para novos usuários. | Velocidade Extrema |
| Modelo 2 | Especializado em reconhecimento de dialetos chineses. Deve ser usado junto com o modelo de pontuação. | Normal |
| Modelo 3 | Suporta inglês e 26 idiomas europeus (italiano, espanhol, alemão, francês, etc.). | Velocidade Extrema |
| Modelo 4 | Cobertura mais ampla: mandarim, dialetos chineses, inglês, japonês, coreano, russo, francês, alemão, árabe, etc., mais de 30 idiomas. | Normal |
| Modelo de pontuação | Suporta complementação de pontuação em chinês e inglês. Pode ser ativado para corrigir problemas de pontuação nos resultados. |
3. Inicie rapidamente sua primeira transcrição
O Owl Meeting oferece dois modos de trabalho principais:
Transcrição em tempo real (modo [Online])
Adequado para reuniões em andamento, conferências ou chamadas de vídeo:
- Clique em [Online] para entrar na interface de transcrição em tempo real.
- Selecione a fonte de som: Microfone (reuniões presenciais), Som do sistema (webcasts/vídeos) ou modo de canal duplo (Tencent Meeting/Zoom, etc.).
- Selecione o modelo de reconhecimento; o Modelo 1 é recomendado para novos usuários.
- Clique em "Iniciar gravação" e o texto será exibido na tela em tempo real.
Para parâmetros detalhados e funções avançadas, consulte a documentação de Transcrição em tempo real.
Transcrição de arquivo (modo [Offline])
Adequado para processar arquivos de áudio ou vídeo existentes:
- Clique em [Offline] para entrar na interface de transcrição de arquivos.
- Arraste os arquivos para a janela ou clique em "Selecionar arquivo". Suporta MP3, WAV, M4A, MP4, MKV e outros formatos comuns.
- Selecione o modelo e o método de segmentação à direita. Recomenda-se o Modelo 1 + Segmentação por intervalo de tempo.
- Clique em "Iniciar reconhecimento"; o progresso será exibido em tempo real.
Interface de operação de transcrição de arquivos
Para parâmetros detalhados e funções avançadas, consulte a documentação de Transcrição de arquivos.
4. Configuração recomendada para novos usuários
Se você for um usuário de primeira viagem, a configuração a seguir ajudará você a começar rapidamente:
- Modelo de reconhecimento: Modelo 1 (Rápido, bom desempenho geral)
- Método de segmentação: Intervalo de tempo (autosegmentação VAD)
- Modo de reconhecimento: Modo regular
- Redução de ruído: Desligado para áudio limpo, ligado para ambientes barulhentos
Recursos avançados como separação de locutores, Reconhecimento de oradores, Dicionário personalizado e Assistente de IA podem ser usados posteriormente para otimizar gradualmente os efeitos.