Docs
Powrót do strony głównej
Powrót do strony głównej

🎞️ Transkrypcja plików audio i wideo

Tryb transkrypcji audio i wideo (tryb offline) został zaprojektowany specjalnie do przetwarzania istniejących plików audio i wideo. Proces odbywa się w całości lokalnie, co gwarantuje zachowanie tajemnicy handlowej i bezpieczeństwo danych.

Ostatnia aktualizacja: 2026-04-21 · Język dokumentacji: Polski

🚀 Szybki start

  1. Importuj pliki: Przeciągnij pliki audio/wideo bezpośrednio do okna oprogramowania lub kliknij „Wybierz plik” na środku.
  2. Wybierz tryb i model: Wybierz wymaganą metodę przetwarzania po prawej stronie interfejsu.
  3. Rozpocznij natychmiast: Kliknij przycisk „Start” poniżej. Możesz obserwować postęp przetwarzania w czasie rzeczywistym (Inicjalizacja -> Przetwarzanie wstępne -> Segmentacja -> Rozpoznawanie).

1. Formaty audio i przetwarzanie wstępne

Owl Meeting posiada silną kompatybilność z plikami, ale zrozumienie poniższych szczegółów przed rozpoczęciem może znacznie poprawić dokładność:

2. Tryb rozpoznawania i segmentacja

Możesz elastycznie łączyć strategie rozpoznawania w zależności od złożoności treści pliku:

3. Tryb testowy

Podgląd efektu rozpoznawania ustawień.

4. Wyjątkowe ustawienia i dostrajanie

W panelu ustawień offline parametry segmentacji VAD (Próg wykrywania głosu, Minimalny czas ciszy/mowy/Maksymalny czas mowy, Wypełnienie krawędzi) są takie same jak w rozpoznawaniu w czasie rzeczywistym. Szczegóły znajdują się w dokumentacji Transkrypcja w czasie rzeczywistym. Poniżej znajdują się elementy konfiguracji dostępne wyłącznie dla transkrypcji plików:

Separacja i tagowanie osób mówiących

Gdy metoda segmentacji jest ustawiona na „Osoba mówiąca”, następujące parametry określają jakość separacji:

Zaawansowana konfiguracja segmentacji

Konfiguracja specyficzna dla modelu

Usługi systemowe

5. Wydajniejsze przetwarzanie końcowe

Po zakończeniu rozpoznawania możesz użyć wbudowanych narzędzi do bezpośredniego generowania wysokiej jakości dokumentów:

6. Najwyższa wydajność

Dzięki głęboko zoptymalizowanemu lokalnemu silnikowi wnioskowania Owl Meeting może osiągać ekstremalne prędkości nawet na procesorze zwykłego komputera biurowego:

7. FAQ i wskazówki

Wskazówka: W przypadku wielokanałowych plików wideo zaleca się użycie wbudowanych narzędzi do wcześniejszego wyodrębnienia/konwersji na dźwięk mono, aby uzyskać jak najdokładniejsze rozpoznawanie.