🎙️ Echtzeit-Besprechungserkennung
Der Echtzeitmodus eignet sich für laufende Besprechungen, Vorträge oder Online-Videoanrufe.
1. Audio-Eingabequelle
Owl Meeting bietet verschiedene Lösungen zur Erfassung von Audioquellen für unterschiedliche Büroszenarien:
- Mikrofon : Konzentriert sich auf die Erfassung Ihrer lokalen Sprache, geeignet für Offline-Vorträge, persönliche Aufnahmen oder Mikrofonaufnahmen in lauten Umgebungen.
- Systemsound : Erfasst direkt verschiedene Computer-Audiosignale, geeignet für die Transkription von Webvideos, Podcasts oder das einfache Zuhören bei Remote-Meetings.
- Dual-Kanal-Modus : Erfasst gleichzeitig Mikrofon und Systemsound. Dies ist die empfohlene Konfiguration für Remote-Meetings (wie Zoom, Microsoft Teams), da sie die Stimmen beider Parteien vollständig aufzeichnen kann.
2. Modus mit niedriger Latenz
Für Büroszenarien, die eine hohe Reaktionsfähigkeit erfordern, können Sie den „Modus mit niedriger Latenz“ aktivieren:
- Streaming-Feedback : Die KI-Engine gibt dynamische Entwürfe mit einer sehr hohen Frequenz aus, was die wahrgenommene Latenz erheblich reduziert.
- Schnelle Korrektur : Während Sie sprechen, wird der Text kontinuierlich basierend auf dem semantischen Kontext automatisch korrigiert, was eine Transkriptionserfahrung von „was man hört, ist was man bekommt“ ermöglicht.
3. Untertitelmodus und Spracheingabe
Die Erkennungsergebnisse sind nicht auf die Softwareoberfläche beschränkt, sondern können über verschiedene Interaktionsmodi in Ihren Workflow integriert werden:
- Untertitelmodus : Nach der Aktivierung erscheint ein transparentes schwebendes Fenster auf dem Desktop. Wenn Sie Livestreams, Remote-Videos oder Video-Tutorials ansehen, können Sie die transkribierten Untertitel in Echtzeit lesen.
- Spracheingabe : Dies ist ein Effizienz-Tool. Nach der Aktivierung wird der erkannte Text direkt in jedes Eingabefeld „getippt“, in dem sich Ihr Cursor befindet (z. B. Word, E-Mail, Chatfenster usw.), genau wie bei einer Eingabemethode.
4. KI-Aufgaben
Bevor Sie mit der Echtzeit-Transkription beginnen, können Sie eine automatisierte KI-Verarbeitungskette vordefinieren:
- Echtzeit : KI-Aufgaben (wie Übersetzung, Zusammenfassung, Polierung usw.) werden in Echtzeit parallel zum Transkriptionsprozess ausgeführt.
5. Umgang mit verlorenen Segmenten bei der Echtzeit-Erkennung
Reduzieren Sie den [Sprachentscheidungsschwellenwert] in den Sprachsegmentierungseinstellungen.
6. Umgang mit zu langen Textsegmenten im Untertitelmodus
Reduzieren Sie die [Maximale Sprachdauer] in den Segmentierungseinstellungen.
7. Umgang mit zunehmend langsamer Reaktionszeit im Modus mit niedriger Latenz
Reduzieren Sie die [Maximale Sprachdauer] in den Segmentierungseinstellungen.
8. Ergebnisse direkt in traditionellem Chinesisch anzeigen lassen
Stellen Sie in den [Einstellungen] die [Vereinfacht/Traditionell-Konvertierung] auf [Traditionelles Chinesisch].