Почему имя диктора не отображается в результатах распознавания?

Убедитесь, что в качестве метода сегментации выбрано 'Разделение дикторов', включена функция 'Маркировка личности', а также проверьте соответствие языка голосового отпечатка.

Как повысить точность распознавания дикторов?

Рекомендуется предоставить 1-2 четких образца голоса для каждого диктора. Порог кластеризации можно динамически настраивать в настройках в зависимости от результата.

На главную

Голосовые отпечатки и управление дикторами

Библиотека голосовых отпечатков — это ключевая функция Owl Meeting, позволяющая системе «знать, кто говорит». Благодаря предварительной записи образцов голоса каждого участника, система может автоматически распознавать и указывать имя диктора при транскрибации файлов, а также назначать наиболее подходящую модель распознавания для каждого человека.

Последнее обновление: 21.04.2026 · Язык документа: Русский

1. Добавление диктора

Перейдите в раздел [Speakers] на левой панели инструментов.
Нажмите [Add Speaker], укажите имя (обязательно) и примечания (опционально).
Назначьте модель распознавания для диктора: при включении «Интеллектуального режима» в транскрибации файлов система будет автоматически использовать указанную здесь модель для распознавания голоса данного диктора.

Интерфейс управления библиотекой голосовых отпечатков

2. Добавление образцов голоса

Выберите диктора и нажмите [Add Audio].
Выберите аудиофайл, содержащий четкую человеческую речь данного диктора.
Установите время начала/окончания в окне обрезки и нажмите кнопку прослушивания для подтверждения.
Выберите Язык голосового отпечатка: выберите «Китайский» для китайских образцов и «English» для английских. Другие языки можно выбирать по языковой группе.
Нажмите «Сохранить», система автоматически извлечет характеристики голоса и свяжет их с диктором.

Добавление и обрезка образцов голоса

Лучшие практики сбора образцов

Качество аудио: выбирайте фрагменты с тихим фоном и только голосом целевого диктора; избегайте моментов, где говорят несколько человек одновременно.
Рекомендуемая длительность: каждый фрагмент должен быть от 5 до 30 секунд. Слишком короткие записи не дадут достаточно характеристик, а слишком длинные не принесут пользы.
Несколько образцов: для одного диктора можно добавить несколько записей. Если голос человека сильно меняется в разных ситуациях (например, при личном общении или по телефону), добавление разных образцов повысит точность распознавания.
Соответствие языка: язык, выбранный при добавлении образца, должен совпадать с «Языком голосового отпечатка» в настройках транскрибации файлов; иначе сопоставление не сработает. Характеристики китайской и английской моделей голоса несовместимы.

3. Текущее обслуживание

Вы можете в любое время изменить имя диктора, примечания и назначенную модель.
Переключайтесь между разными образцами и прослушивайте их напрямую.
При удалении образца соответствующий локальный аудиофайл также будет удален.

4. Как голосовые отпечатки работают при транскрибации

Библиотека голосов в основном используется в режиме оффлайн-транскрибации файлов. Чтобы имена дикторов отображались автоматически, должны быть соблюдены следующие условия:

Выбран метод сегментации «По дикторам».
Включен переключатель «Маркировка личности».
«Язык голосового отпечатка» в настройках транскрибации файлов совпадает с языком, выбранным при добавлении образцов.

При соблюдении этих условий метки дикторов в результатах распознавания будут автоматически заменены на реальные имена из библиотеки.

5. Часто задаваемые вопросы и решение проблем

В: Почему в результатах отображается только Speaker_0, Speaker_1, а не имена?
О: Проверьте три пункта из раздела «Как голосовые отпечатки работают при транскрибации». Самая частая причина — забыли включить «Маркировку личности» или не совпадает язык голосового отпечатка.
В: Имена проставились, но они перепутаны?
О: Попробуйте повысить «Порог соответствия распознавания» (в разделе «Разделение и маркировка дикторов» в настройках транскрибации файлов) или добавьте более четкие образцы голоса для соответствующего диктора.
В: Автоматически определено неверное количество человек?
О: Рекомендуется вручную указать «Количество дикторов» в настройках. При использовании автоматического режима можно подстроить [Cluster Threshold], чтобы отрегулировать чувствительность системы к различиям в голосах.

Совет: При создании библиотеки добавьте по 1-2 четких образца голоса для каждого постоянного участника. После настройки библиотеки все последующие транскрибации будут автоматически определять личности без повторной настройки.