Question 1

Wordt mijn video naar een server geüpload?

Accepted Answer

Nee. Beide stappen draaien 100% in je browser: ffmpeg (WebAssembly) haalt de audio eruit en Whisper transcribeert die op je apparaat. Je media verlaten je computer nooit. Het enige netwerkverzoek is een eenmalige download van de open-source modelgewichten vanaf een openbaar CDN.

Question 2

Welke talen en formaten worden ondersteund?

Accepted Answer

Whisper is meertalig en verwerkt meer dan 90 talen, waaronder Koreaans, Engels, Japans, Chinees, Spaans en meer, met automatische detectie. Je kunt SRT, WebVTT of een platte-teksttranscriptie exporteren en anderstalige spraak eventueel naar Engelse ondertitels vertalen.

Question 3

Welk model moet ik kiezen?

Accepted Answer

Small is de aanbevolen standaard en het praktische minimum voor goed Koreaans en andere CJK-talen. Tiny is het snelst en lichtst maar minder nauwkeurig; Turbo (large-v3-turbo) is het nauwkeurigst maar downloadt enkele honderden megabytes en werkt het best met WebGPU. Alle modellen worden één keer gedownload en daarna gecachet.

Question 4

Waarom is de eerste keer traag?

Accepted Answer

De eerste keer dat je een model gebruikt, worden de gewichten één keer gedownload (tientallen MB voor Tiny/Small, meer voor Turbo) en daarna gecachet voor de volgende keer. De transcriptie zelf is veel sneller op browsers met WebGPU; zonder GPU valt hij terug op de CPU en kunnen lange video's even duren.

Question 5

Zijn de ondertitels nauwkeurig genoeg om te publiceren?

Accepted Answer

Automatisch gegenereerde ondertitels zijn een sterke eerste versie, maar niet perfect — ze kunnen namen verkeerd verstaan of losse tekst toevoegen bij muziek of stilte. Daarom is hier elke regel bewerkbaar: controleer en corrigeer de transcriptie voordat je die downloadt, zeker voor toegankelijkheid.

Question 6

Is er een limiet op de bestandsgrootte?

Accepted Answer

Alles draait in het geheugen van je browser, dus heel grote of heel lange bestanden kunnen traag zijn of het geheugen laten vollopen. Bestanden groter dan ongeveer 500 MB tonen een waarschuwing en bestanden groter dan 2 GB worden geblokkeerd. Voor lange opnames helpt een kortere clip of een kleiner model.

Video naar ondertitels (spraakherkenning)

Wat is Video naar ondertitels (spraakherkenning)?

Video naar ondertitels (spraakherkenning) gebruiken

Voorbeelden

Een Koreaans interview ondertitelen als SRT-bestand

WebVTT-ondertitels maken voor een webvideo

Een Japans college naar Engelse ondertitels vertalen

Veelgestelde vragen

Gerelateerde tools

Beeldformaat-converter

Excel/CSV naar JSON

EXIF-viewer en metadataverwijderaar

Favicon-generator