Документация
На главную
На главную

📖 Оптимизация пользовательского словаря

Модели распознавания речи иногда ошибочно принимают профессиональные термины, имена или отраслевой жаргон за омофонические ошибки. С помощью функции пользовательского словаря вы можете установить правила автоматического исправления, позволяя системе автоматически исправлять эти известные ошибки после распознавания, что со временем делает результаты более точными.

Последнее обновление: 21.04.2026 · Язык: Русский

1. Три типа правил исправления

Перейдите на страницу «Словарь» в левой боковой панели, чтобы управлять следующими тремя типами правил:

Интерфейс управления правилами словаря Интерфейс управления правилами словаря

Правила удаления

Полностью удаляйте указанные слова из результата распознавания. Идеально подходит для фильтрации слов-паразитов и повторяющихся фраз.

Замена текста

Напрямую заменяйте неправильно распознанный текст правильным. Идеально подходит для исправления постоянных опечаток.

Фонетическая замена (только для китайского языка)

Исправляйте ошибки на основе фонетического соответствия. Это самый эффективный способ исправления ошибок, когда модель правильно слышит звук, но выводит неправильные иероглифы.

2. Интеллектуальное извлечение терминов

Если у вас есть правильный справочный текст (например, повестка дня собрания, руководство по продукту), вы можете позволить системе автоматически извлекать из него профессиональные термины:

  1. На странице «Словарь» нажмите «Интеллектуальное извлечение».
  2. Вставьте фрагмент справочного текста в поле ввода.
  3. Выберите метод извлечения (имена собственные / высокая частота / новые термины) и количество.
  4. Нажмите «Начать анализ», чтобы увидеть термины-кандидаты.
  5. Просмотрите список и одним щелчком мыши импортируйте подтвержденные термины в словарь.
  6. Интерфейс интеллектуального извлечения терминов Интерфейс интеллектуального извлечения терминов

Эта функция идеально подходит для быстрого создания списка профессиональных слов перед началом нового отраслевого проекта.

3. Массовый импорт фонетических списков

Если у вас уже есть большой список терминов для исправления, воспользуйтесь функцией массового импорта, чтобы загрузить фонетические списки целиком, избавившись от необходимости добавлять элементы по отдельности.

4. Самый простой способ обслуживания

Вам не нужно специально заходить на страницу словаря. При выполнении пакетной замены или удаления в деталях истории установите флажок «Синхронизировать словарь», чтобы автоматически сохранить изменение как постоянное правило.

Совет по использованию: Для китайских профессиональных терминов отдавайте приоритет «Фонетической замене». Она охватывает более широкий спектр, чем замена текста — одно фонетическое правило может исправить все омофонические ошибки.