👤 Sprecherverwaltung
Bei Besprechungen mit mehreren Personen ist es ratsam, zuerst die Sprecherbibliothek einzurichten, um die spätere Trennung und Identifizierung bei der Transkription zu erleichtern.
1. Sprecher hinzufügen
- Rufen Sie die Seite „Sprecherverwaltung“ auf.
- Klicken Sie auf „Neu“. Der Sprechername ist erforderlich, Notizen sind optional.
- Wählen Sie bei Bedarf ein spezifisches Erkennungsmodell für diesen Sprecher aus (wenn der intelligente Modus aktiviert ist, wird dieses Modell vorrangig zur Erkennung verwendet).
2. Audio-Samples für Sprecher hinzufügen
- Wählen Sie eine klare Audiodatei aus, die ausschließlich die Stimme der Zielperson enthält.
- Legen Sie im Schnittfenster Start- und Endzeit fest und hören Sie zur Bestätigung kurz rein.
- Wählen Sie die Sprachkategorie aus (z. B. Chinesisch, Englisch oder andere systembasierte Sprachtypen).
- Klicken Sie auf Speichern; das System extrahiert automatisch die Merkmale und fügt sie dem Sprecher hinzu.
3. Tägliche Pflege
- Ein Sprecher kann mehrere Audio-Samples haben.
- Samples können jederzeit gewechselt oder direkt angehört werden.
- Name, Notizen oder das bevorzugte Modell können jederzeit geändert werden.
- Das Löschen eines Samples löscht gleichzeitig die entsprechende lokale Audio-Sample-Datei.
4. Warum erscheint der Name nicht in den Offline-Erkennungsergebnissen?
Die Sprecherbibliothek wird vorrangig bei der Offline-Datei-Transkription wirksam. Bitte prüfen Sie folgendes:
- Ist die Segmentierungsmethode auf „Sprecherdiarisierung (Aufteilung nach Sprecher)“ eingestellt?
- Ist die Funktion „Sekundäre Sprecheridentifikation“ aktiviert?
- Entspricht die bei der Offline-Erkennung gewählte Sample-Sprache der Sprache Ihrer Samples?
- Senken Sie ggf. den [Cluster-Schwellenwert] in den Offline-Einstellungen.
5. Warum wird in den Offline-Erkennungsergebnissen ein falscher Name angezeigt?
- Erhöhen Sie den Schwellenwert für den Erkennungsabgleich.
- Fügen Sie dem Sprecher weitere passende Audio-Samples hinzu.
Empfehlung: Fügen Sie je nach Bedarf ein oder zwei klare Audio-Samples in der
entsprechenden Sprache hinzu, um die besten Ergebnisse zu erzielen.