👤 Gestione Speaker e Impronta Vocale
Per le riunioni con più partecipanti, si consiglia di configurare prima la libreria degli speaker; ciò renderà più facile distinguere "chi sta parlando" durante la trascrizione.
1. Aggiungere un nuovo Speaker
- Entra in "Gestione Speaker".
- Clicca su aggiungi; il nome dello speaker è obbligatorio, le note sono facoltative.
- Se necessario, seleziona il modello di riconoscimento per lo speaker (attivando la modalità intelligente, verrà utilizzato questo modello).
2. Aggiungere audio campione allo Speaker
- Seleziona un file audio chiaro con la voce dello speaker.
- Nella finestra di ritaglio, imposta l'ora di inizio/fine e ascolta l'anteprima.
- Seleziona la categoria della lingua (cinese per campioni in cinese, inglese per campioni in inglese; per altre lingue puoi scegliere quella più affine).
- Clicca su salva; il sistema estrarrà automaticamente le caratteristiche e le aggiungerà allo speaker.
3. Manutenzione quotidiana
- Puoi aggiungere più campioni audio per lo stesso speaker.
- Puoi cambiare il campione corrente e ascoltarlo direttamente.
- Puoi modificare in qualsiasi momento nome, note e modello assegnato.
- Eliminando un campione, verrà eliminato anche il file audio locale corrispondente.
4. Perché il nome non appare nei risultati della trascrizione offline?
La libreria vocale è efficace principalmente nella trascrizione di file offline. Verifica quanto segue:
- Assicurati che il metodo di segmentazione scelto sia "Segmentazione per Speaker".
- Assicurati che l'etichettatura dell'identità sia attivata.
- Verifica che la lingua vocale selezionata durante la trascrizione offline corrisponda a quella scelta durante l'inserimento dei frammenti dello speaker.
- Abbassa la soglia di clustering nelle impostazioni offline.
5. Perché il nome visualizzato nei risultati della trascrizione offline non è corretto?
- Aumenta la soglia di corrispondenza per il riconoscimento.
- Aggiungi nuovamente i campioni audio per lo speaker corrispondente.
Suggerimento: Aggiungi uno o due campioni audio chiari della lingua corrispondente per ogni
speaker.