Початок роботи
Owl Meeting — це інструмент підвищення продуктивності роботи з голосом для Windows, який працює на 100% локально. Усе розпізнавання мовлення та ШІ-обробка виконуються на вашому комп'ютері без необхідності підключення до Інтернету, і дані ніколи не передаються зовні. Дотримуючись цього посібника, ви зможете завершити свою першу транскрипцію за кілька хвилин.
1. Встановлення та системні вимоги
- Джерело встановлення: Знайдіть «Owl Meeting» у Microsoft Store, щоб встановити програму та отримувати автоматичні оновлення.
- Залежність середовища виконання: Рушію розпізнавання мовлення потрібна підтримка бібліотек Visual C++ Redistributable. Якщо при першому запуску з'явиться запит, завантажте та встановіть їх відповідно до інструкцій, а потім перезапустіть програму.
- Системні вимоги: Windows 10/11, архітектура x64. Дискретна відеокарта не потрібна; процесора звичайного офісного комп'ютера достатньо для плавної роботи.
2. Завантаження моделей
Після першого запуску необхідно завантажити ШІ-моделі на сторінці «Налаштування → Керування моделями». Після завершення завантаження моделей програма може працювати повністю автономно:
Інтерфейс керування моделями та завантаження
| Модель | Опис функцій | Швидкість |
|---|---|---|
| Модель 1 (рекомендовано) | Підтримує китайську, англійську, японську та корейську мови. Дуже швидка, підходить для більшості сценаріїв. Найкращий вибір для нових користувачів. | Надшвидка |
| Модель 2 | Спеціалізується на розпізнаванні китайських діалектів. Має використовуватися разом із пунктуаційною моделлю. | Нормальна |
| Модель 3 | Підтримує англійську та 26 європейських мов (італійську, іспанську, німецьку, французьку тощо). | Надшвидка |
| Модель 4 | Найширше охоплення: путунхуа, китайські діалекти, англійська, японська, корейська, російська, французька, німецька, арабська тощо, понад 30 мов. | Нормальна |
| Пунктуаційна модель | Підтримує розстановку розділових знаків для китайської та англійської мов. Може бути активована для виправлення проблем із пунктуацією в результатах. |
3. Швидкий початок вашої першої транскрипції
Owl Meeting пропонує два основні режими роботи:
Транскрипція в реальному часі ([Online])
Підходить для поточних зустрічей, лекцій або відеодзвінків:
- Натисніть «Онлайн», щоб увійти в інтерфейс транскрипції в реальному часі.
- Виберіть джерело звуку: мікрофон (очні зустрічі), системний звук (веб-трансляції/відео) або двоканальний режим (Zoom/Teams тощо).
- Виберіть модель розпізнавання; для нових користувачів рекомендується Модель 1.
- Натисніть «Почати запис», і текст відображатиметься на екрані в режимі реального часу.
Для докладного ознайомлення з параметрами та розширеними функціями див. документацію з Транскрипції в реальному часі.
Транскрипція файлів (офлайн-режим)
Підходить для обробки існуючих аудіо- або відеофайлів:
- Натисніть «Офлайн», щоб увійти в інтерфейс транскрипції файлів.
- Перетягніть аудіо/відеофайли у вікно або натисніть кнопку «Вибрати файл». Підтримуються MP3, WAV, M4A, MP4, MKV та інші популярні формати.
- Виберіть модель розпізнавання та метод сегментації праворуч. Для нових користувачів рекомендується Модель 1 + сегментація за часовим інтервалом.
- Натисніть «Почати розпізнавання»; прогрес відображатиметься в реальному часі.
Інтерфейс транскрипції файлів
Для докладного ознайомлення з параметрами та розширеними функціями див. документацію з Транскрипції файлів.
4. Рекомендована конфігурація для нових користувачів
Якщо ви використовуєте програму вперше, наступна конфігурація допоможе вам швидко ввійти в курс справи:
- Модель розпізнавання: Модель 1 (швидка, хороша універсальність)
- Метод сегментації: Часовий інтервал (автосегментація VAD, не потребує додаткового налаштування)
- Режим розпізнавання: Звичайний режим
- Шумозаглушення: вимкнено при чистому записі, увімкнено при шумній обстановці
Надалі ви зможете використовувати такі розширені функції, як розділення мовців, розпізнавання голосу, спеціальний словник та ШІ-асистент для поступової оптимізації результатів.