👤 Zarządzanie głosami i mówcami
W przypadku spotkań wieloosobowych zalecamy wcześniejsze skonfigurowanie bazy mówców – ułatwi to późniejsze rozróżnienie „kto mówi”.
1. Dodawanie nowego mówcy
- Wejdź w sekcję „Zarządzanie głosami”.
- Kliknij „Dodaj”. Imię mówcy jest wymagane, pole uwag jest opcjonalne.
- W razie potrzeby wybierz model rozpoznawania dla danego mówcy (zostanie on użyty po włączeniu „Trybu inteligentnego”).
2. Dodawanie próbek głosu
- Wybierz plik z wyraźnym nagraniem głosu danej osoby.
- W oknie przycinania ustaw czas rozpoczęcia i zakończenia, a następnie sprawdź nagranie.
- Wybierz kategorię językową (Np. 'Chiński' dla próbek chińskich, 'Angielski' dla próbek angielskich; w przypadku innych języków wybierz kategorię o zbliżonej charakterystyce dźwiękowej).
- Kliknij zapisz. System automatycznie wyodrębni cechy głosu i przypisze je do mówcy.
3. Bieżąca obsługa i konserwacja
- Dla jednego mówcy można dodać wiele próbek głosu.
- Możesz łatwo przełączać się między próbkami i odsłuchiwać je bezpośrednio.
- W dowolnym momencie możesz zmienić imię, uwagi lub przypisany model.
- Usunięcie próbki powoduje jednoczesne usunięcie lokalnego pliku nagrania.
4. Dlaczego nazwisko nie pojawia się w wynikach transkrypcji offline?
Baza głosów działa głównie w trybie transkrypcji plików offline. Sprawdź następujące elementy:
- Upewnij się, że metoda segmentacji to „Segmentacja według mówców”.
- Upewnij się, że opcja „Oznaczanie tożsamości” jest włączona.
- Sprawdź, czy język wybrany podczas transkrypcji offline zgadza się z językiem próbki głosu w bazie.
- Spróbuj obniżyć próg klastrowania w ustawieniach offline.
5. Dlaczego wyświetlane nazwisko mówcy jest błędne?
- Zwiększ próg dopasowania w bazie głosów.
- Dodaj ponownie świeże i wyraźne próbki nagrania dla tego mówcy.
Sugestia: Dodaj jedną lub dwie wyraźne próbki głosu dla każdej osoby, biorąc pod uwagę
język, w którym najczęściej mówi.