👤 声紋と話者管理
複数人の会議では、あらかじめ話者ライブラリを構築しておくことで、その後の文字起こしで「誰が話しているか」を区別しやすくなります。
1. 話者の新規追加
- 「声紋管理」を開きます。
- [新規追加]をクリックします。話者の名前は必須、備考は任意です。
- 必要に応じて、その話者専用の認識モデルを選択します(スマートモードが有効な場合、このモデルが使用されます)。
2. 話者のサンプル音声の追加
- クリアな本人の音声ファイルを選択します。
- トリミングウィンドウで開始/終了時間を設定し、試聴します。
- 言語分類を選択します(中国語サンプルは中国語、英語サンプルは英語。その他の言語は語系に合わせて選択してください)。
- [保存]をクリックすると、システムが自動的に特徴量を抽出し、その話者に追加します。
3. 日常のメンテナンス
- 1人の話者に対して複数のサンプルを登録できます。
- 現在のサンプルを切り替えて直接試聴できます。
- 名前、備考、使用モデルはいつでも変更可能です。
- サンプルを削除すると、対応するローカルサンプルファイルも同時に削除されます。
4. オフライン認識結果に名前が表示されない場合
声紋ライブラリは主にオフラインファイル文字起こしで機能します。以下を確認してください:
- 分割方式で「話者ごとの分割」が選択されているか。
- 「IDタグ付け」が有効になっているか。
- オフライン認識時に選択した声紋言語が、話者の追加時に選択した言語と一致しているか。
- オフライン設定でクラスタリングしきい値を下げる。
5. オフライン認識結果の名前が正しくない場合
- 認識マッチングしきい値を上げる。
- 該当する話者の音声サンプルを再度追加する。
アドバイス: 実際の状況に合わせて、対応する言語系のサンプル音声を1つか2つ追加することをお勧めします。