📖 Оптимизация пользовательского словаря
Модели распознавания речи иногда ошибочно принимают профессиональные термины, имена или отраслевой жаргон за омофонические ошибки. С помощью функции пользовательского словаря вы можете установить правила автоматического исправления, позволяя системе автоматически исправлять эти известные ошибки после распознавания, что со временем делает результаты более точными.
1. Три типа правил исправления
Перейдите на страницу «Словарь» в левой боковой панели, чтобы управлять следующими тремя типами правил:
Интерфейс управления правилами словаря
Правила удаления
Полностью удаляйте указанные слова из результата распознавания. Идеально подходит для фильтрации слов-паразитов и повторяющихся фраз.
- Пример: при добавлении «ну», «эм», «как бы» эти слова будут автоматически удаляться из расшифровки.
Замена текста
Напрямую заменяйте неправильно распознанный текст правильным. Идеально подходит для исправления постоянных опечаток.
- Пример: «ии ассистент» → «ИИ-ассистент», «протокол встречи» → «Минуты»
Фонетическая замена (только для китайского языка)
Исправляйте ошибки на основе фонетического соответствия. Это самый эффективный способ исправления ошибок, когда модель правильно слышит звук, но выводит неправильные иероглифы.
- Введите целевые иероглифы, и система автоматически создаст соответствующий пиньинь.
- Пример: ввод «永磁» (yong3ci2) автоматически исправит все омофонические ошибки, такие как «泳磁» или «勇磁».
2. Интеллектуальное извлечение терминов
Если у вас есть правильный справочный текст (например, повестка дня собрания, руководство по продукту), вы можете позволить системе автоматически извлекать из него профессиональные термины:
- На странице «Словарь» нажмите «Интеллектуальное извлечение».
- Вставьте фрагмент справочного текста в поле ввода.
- Выберите метод извлечения (имена собственные / высокая частота / новые термины) и количество.
- Нажмите «Начать анализ», чтобы увидеть термины-кандидаты.
- Просмотрите список и одним щелчком мыши импортируйте подтвержденные термины в словарь.
Интерфейс интеллектуального извлечения терминов
Эта функция идеально подходит для быстрого создания списка профессиональных слов перед началом нового отраслевого проекта.
3. Массовый импорт фонетических списков
Если у вас уже есть большой список терминов для исправления, воспользуйтесь функцией массового импорта, чтобы загрузить фонетические списки целиком, избавившись от необходимости добавлять элементы по отдельности.
4. Самый простой способ обслуживания
Вам не нужно специально заходить на страницу словаря. При выполнении пакетной замены или удаления в деталях истории установите флажок «Синхронизировать словарь», чтобы автоматически сохранить изменение как постоянное правило.