Question 1

Ma vidéo est-elle envoyée sur un serveur ?

Accepted Answer

Non. Les deux étapes se déroulent à 100 % dans votre navigateur : ffmpeg (WebAssembly) extrait l'audio et Whisper le transcrit sur votre appareil. Vos médias ne quittent jamais votre ordinateur. La seule requête réseau est le téléchargement unique des poids du modèle open source depuis un CDN public.

Question 2

Quelles langues et quels formats sont pris en charge ?

Accepted Answer

Whisper est multilingue et gère plus de 90 langues, dont le coréen, l'anglais, le japonais, le chinois, l'espagnol et bien d'autres, avec détection automatique. Vous pouvez exporter du SRT, du WebVTT ou une transcription en texte brut, et éventuellement traduire une parole non anglaise en sous-titres anglais.

Question 3

Quel modèle choisir ?

Accepted Answer

Small est la valeur par défaut recommandée et le minimum pratique pour un bon rendu du coréen et des autres langues CJK. Tiny est le plus rapide et le plus léger mais moins précis ; Turbo (large-v3-turbo) est le plus précis mais télécharge plusieurs centaines de mégaoctets et fonctionne au mieux avec WebGPU. Tous les modèles sont téléchargés une seule fois puis mis en cache.

Question 4

Pourquoi le premier lancement est-il lent ?

Accepted Answer

La première fois que vous utilisez un modèle, ses poids se téléchargent une fois (quelques dizaines de MB pour Tiny/Small, davantage pour Turbo) puis sont mis en cache pour la suite. La transcription elle-même est bien plus rapide sur les navigateurs compatibles WebGPU ; sans GPU, elle bascule sur le CPU et les longues vidéos peuvent prendre du temps.

Question 5

Les sous-titres sont-ils assez précis pour être publiés ?

Accepted Answer

Les sous-titres générés automatiquement sont un excellent premier jet, mais pas parfaits : ils peuvent mal comprendre des noms ou ajouter du texte parasite sur de la musique ou du silence. C'est pourquoi chaque ligne est modifiable ici : relisez et corrigez la transcription avant de la télécharger, surtout pour l'accessibilité.

Question 6

Y a-t-il une limite de taille de fichier ?

Accepted Answer

Tout s'exécute dans la mémoire de votre navigateur : les fichiers très volumineux ou très longs peuvent donc être lents ou manquer de mémoire. Les fichiers de plus de 500 MB environ affichent un avertissement et ceux de plus de 2 GB sont bloqués. Pour les longs enregistrements, un clip plus court ou un modèle plus petit aide.

Vidéo en sous-titres (reconnaissance vocale)

Qu'est-ce que Vidéo en sous-titres (reconnaissance vocale) ?

Comment utiliser Vidéo en sous-titres (reconnaissance vocale)

Exemples

Sous-titrer une interview en coréen dans un fichier SRT

Créer des sous-titres WebVTT pour une vidéo web

Traduire un cours en japonais en sous-titres anglais

Questions fréquentes

Outils connexes

Convertisseur de format d'image

Excel/CSV vers JSON

Visionneuse EXIF et suppresseur de métadonnées

Générateur de favicon