Dokumentacja
Powrót do strony głównej
Powrót do strony głównej

Zarządzanie wzorcami głosu i mówcami

Biblioteka wzorców głosu to kluczowa funkcja aplikacji Owl Meeting pozwalająca „wiedzieć, kto mówi”. Dzięki wcześniejszemu nagraniu próbek głosu każdej osoby, system może automatycznie rozpoznawać i oznaczać nazwisko mówcy podczas transkrypcji plików, a nawet przypisywać najbardziej odpowiedni model rozpoznawania dla różnych osób.

Ostatnia aktualizacja: 21.04.2026 · Język dokumentacji: Polski

1. Dodawanie mówcy

  1. Przejdź do „Biblioteki wzorców głosu” na lewym pasku narzędzi.
  2. Kliknij „Dodaj osobę”, wpisz imię i nazwisko (wymagane) oraz uwagi (opcjonalnie).
  3. Przypisz model rozpoznawania dla mówcy: po włączeniu „Trybu inteligentnego” w transkrypcji plików, system automatycznie użyje modelu wskazanego w tym miejscu do rozpoznawania głosu mówcy.
  4. Interfejs zarządzania biblioteką wzorców głosu Interfejs zarządzania biblioteką wzorców głosu

2. Dodawanie próbek wzorców głosu

  1. Wybierz mówcę i kliknij „Dodaj audio”.
  2. Wybierz plik audio zawierający wyraźny ludzki głos wybranego mówcy.
  3. Ustaw czas rozpoczęcia i zakończenia w oknie przycinania, a następnie kliknij odsłuch, aby potwierdzić.
  4. Wybierz Język wzorca głosu: wybierz „Chiński” dla próbek chińskich oraz „English” dla próbek angielskich. Inne języki można wybierać na podstawie grup językowych.
  5. Kliknij zapisz – system automatycznie wyodrębni cechy wzorca głosu i powiąże je z mówcą.
  6. Dodawanie i przycinanie próbek wzorców głosu Dodawanie i przycinanie próbek wzorców głosu

Najlepsze praktyki przy zbieraniu próbek

3. Codzienna konserwacja

4. Jak wykorzystać wzorce głosu podczas transkrypcji

Biblioteka wzorców głosu odgrywa rolę głównie w transkrypcji plików offline. Aby wyniki transkrypcji automatycznie wyświetlały nazwę mówcy, muszą zostać spełnione jednocześnie następujące warunki:

  1. Wybierz „Mówcę” jako metodę segmentacji.
  2. Włącz przełącznik „Oznaczanie tożsamości”.
  3. „Język wzorca głosu” w ustawieniach transkrypcji plików jest zgodny z językiem wybranym podczas dodawania próbek.

Po spełnieniu powyższych warunków tag mówcy w wyniku rozpoznawania zostanie automatycznie zastąpiony prawdziwym nazwiskiem wprowadzonym do biblioteki wzorców głosu.

5. FAQ i rozwiązywanie problemów

Sugestia: dodaj 1-2 wyraźne próbki ludzkiego głosu dla każdego stałego uczestnika podczas tworzenia biblioteki. Po utworzeniu biblioteki wzorców głosu wszystkie kolejne transkrypcje plików będą mogły automatycznie identyfikować tożsamość bez konieczności powtarzania konfiguracji.