Propulsé par l'IA locale

Reconnaissance Vocale
Professionnelle

Reconnaissance d'enregistrement en temps réel et transcription de fichiers audio/vidéo. Séparation des locuteurs et traitement par IA.

Rapide sur CPU
100% Confidentialité
Entièrement Hors Ligne

Outils pour l'Efficacité

Reconnaissance Intelligente

Attribuez des modèles de reconnaissance dédiés à différents locuteurs avec changement automatique.

  • Modèle optimal basé sur l'empreinte vocale
  • Réduction significative du travail de post-édition

Gestion Complète

Gérez l'historique, la bibliothèque d'empreintes vocales et les résultats de reconnaissance.

  • Stockage persistant des empreintes vocales
  • Recherche rapide dans l'historique

Puissantes Fonctions d'Édition

Dictionnaire personnalisé avec auto-correction, édition par lots, correction IA

  • Remplacement de texte, remplacement de pinyin et suppression de mots dans le dictionnaire
  • Cliquez sur le texte pour aller à la position audio, écoutez en éditant
Rapide sur CPU

Pas de GPU Requis,
Rapide sur CPU

Performance Ultime

Basé sur plusieurs modèles ASR efficaces, transcrivez 30min d'audio en seulement 1min sur CPU *

Adieu la Complexité

Installation en un clic, téléchargement de modèle en un clic, interface graphique

Contrôle Total de la Confidentialité

Toutes les données traitées localement, sans internet, les informations sensibles ne fuient jamais.

* Données basées sur i5-11400H
En ligne
Hors ligne
Historique
Empreintes
Dict.
AI
2speakers.wav
00:00:00 / 00:00:51
5 seg. | 2 locuteurs Tous les locuteurs ▾
Rechercher
小白 00:00:00 - 00:00:23

嗯,那么今天我们就简单的进行一下新生招聘的讨论吧...

小北 00:00:24 - 00:00:34

嗯,地点的话我们现在可以有三个选择...

小白 00:00:34 - 00:00:40

操场的话,这段时间太热了,我怕人流量有点少

小北 00:00:41 - 00:00:50

确实,那考虑室内体育馆怎么样?

Local LLM (Ollama)

Intégration Profonde de LLM Local,
Au-delà de la "Transcription"

Facile à utiliser

Prend en charge le lancement en un clic et une gestion intuitive des modèles, pour rendre même les grands modèles complexes faciles à utiliser

Templates IA Professionnels

Pré-configuré pour la traduction en un clic, le résumé et la correction

Prompts personnalisés extensibles

Adaptez l'IA à votre flux de travail avec des prompts personnalisés

En ligne
Hors ligne
Historique
Empreintes
Dict.
AI
5 seg. | 2 locuteurs
Source Trad. Corr. Person.
2speakers.wav
00:00:00 / 00:00:51
小白 00:00:00 - 00:00:23

嗯,那么今天我们就简单的进行一下新生招聘的讨论吧...

Well, then we can discuss the recruitment of new graduates today...

小北 00:00:24 - 00:00:34

嗯,地点的话我们现在可以有三个选择...

Well, the location options we have now are three choices...

小白 00:00:35 - 00:00:45

我觉得我们可以把重点放在计算机学院那边...

I think we can focus on the Computer Science College...

Questions fréquentes

Une connexion internet est-elle nécessaire ?

Non. L'inférence du modèle et le stockage des données sont effectués localement.

L'utilisation d'un GPU est-elle obligatoire ?

Non. Les modèles de transcription vocale intégrés sont optimisés pour l'inférence sur CPU. Même un CPU vieux de 10 ans peut traiter 30 minutes d'audio en environ 3 minutes. Avec Ollama pour les grands modèles, un meilleur GPU permet d'utiliser des modèles plus avancés.

Puis-je enregistrer en même temps le micro et le son système ?

Oui. La reconnaissance simultanée sur deux canaux est prise en charge.

Quelles langues sont prises en charge et quelle est la précision ?

Mandarin (97 %), dialectes chinois (90 %), anglais (95 %), coréen, japonais, italien (97 %), espagnol (96 %), portugais (95 %), allemand (95 %), français (95 %), russe (94 %), ukrainien (93 %), polonais (93 %), néerlandais (93 %) et 25 autres langues européennes.

Les fonctions d'édition sont-elles prises en charge ?

Oui. Il dispose de puissantes fonctions d'édition : traitement automatique via dictionnaire personnalisé ; mode écoute-et-correction avec lecture audio automatique au clic sur le résultat ; modification et suppression par lots avec mise à jour automatique du dictionnaire.

Quels formats sont pris en charge ?

Prend en charge les principaux formats audio, dont MP3, WAV, FLAC, AAC, M4A, OGG, AIFF, ALAC, CAF, PCM, ADPCM et WebM. Les vidéos ou les fichiers audio multicanaux peuvent être convertis via les outils intégrés avant la reconnaissance.

Est-ce disponible gratuitement ?

L'utilisation du logiciel peut nécessiter un code d'activation. Toutefois, si vous avez une raison de demander un accès gratuit, vous pouvez l'expliquer dans la section des commentaires et laisser votre e-mail.

Prêt pour plusieurs plateformes

Windows

Prend en charge Win 10 et supérieur.

Télécharger maintenant

macOS

Optimisé pour Intel et Apple Silicon, efficacité maximale.

Bientôt