Video zu Untertiteln (Sprache zu Text)
Erzeuge SRT-, VTT- oder Text-Untertitel aus jedem Video oder Audio, indem die Sprache mit Whisper lokal in deinem Browser transkribiert wird – ganz ohne Upload.
Video zu Untertiteln (Sprache zu Text) — Verwandle den gesprochenen Ton eines Videos in fertige Untertitel, ohne irgendetwas hochzuladen. Zieh eine MP4-, MOV-, WebM- oder MKV-Datei oder eine Audiodatei hinein, und dieses Tool extrahiert den Ton, führt OpenAIs Whisper-Spracherkennungsmodell direkt in deinem Browser aus und erzeugt mit Zeitstempeln versehene SRT-, WebVTT- oder Text-Untertitel, die du bearbeiten und herunterladen kannst. Der Ton verlässt dein Gerät nie – nur die quelloffenen Modellgewichte werden einmalig von einem öffentlichen CDN geladen –, sodass deine Aufnahmen vollständig privat bleiben.
Was ist Video zu Untertiteln (Sprache zu Text)?
Ein kostenloser, privater Video-zu-Untertitel-Generator, der Sprache vollständig in deinem Browser in Untertitel mit Zeitstempeln transkribiert. Er nutzt ffmpeg, kompiliert zu WebAssembly, um 16-kHz-Audio aus deinem Video zu ziehen, und führt dann das mehrsprachige Whisper-Modell aus (per WebGPU, sofern verfügbar, sonst über die CPU), um die Sprache zu erkennen und auf einer Zeitleiste zu platzieren. Kreative, Editoren, Studierende und Barrierefreiheits-Teams untertiteln damit Interviews, Vorlesungen, Tutorials und Social-Clips in über 90 Sprachen – darunter Koreanisch, Japanisch und Chinesisch – und exportieren SRT für Videoschnittprogramme, WebVTT fürs Web oder ein sauberes Text-Transkript. Wähle eine Modellgröße, um Geschwindigkeit gegen Genauigkeit abzuwägen, erkenne die Sprache automatisch oder lege sie fest, übersetze die Sprache optional ins Englische und korrigiere anschließend jede Zeile im integrierten Editor, bevor du herunterlädst.
So verwendest du Video zu Untertiteln (Sprache zu Text)
- Zieh eine Video- oder Audiodatei auf die Ablagefläche oder klicke, um eine auszuwählen. Es wird nichts hochgeladen – die Datei wird lokal gelesen.
- Wähle ein Modell: Tiny für Tempo, Small für die Balance (empfohlen) oder Turbo für die beste Genauigkeit. Größere Modelle laden beim ersten Mal mehr Daten herunter.
- Lass die Sprache auf Automatisch erkennen oder wähle die gesprochene Sprache für mehr Genauigkeit. Aktiviere Ins Englische übersetzen, wenn du aus fremdsprachiger Sprache englische Untertitel möchtest.
- Klicke auf Untertitel erzeugen. Beim ersten Durchlauf wird das Modell einmal heruntergeladen (danach ist es zwischengespeichert); der Ton wird in deinem Browser extrahiert und transkribiert.
- Wähle SRT, VTT oder Text, bearbeite jede Zeile zur Korrektur der Formulierung, sieh dir die Untertitel im Video an und lade dann die Untertiteldatei herunter.
Beispiele
Ein koreanisches Interview als SRT-Datei untertiteln
Zieh den Clip hinein, lass das Modell auf Small (oder Turbo für saubereres Koreanisch), belasse die Sprache auf Automatisch erkennen und exportiere eine .srt mit Zeitstempeln zum Laden in dein Videoschnittprogramm.
WebVTT-Untertitel für ein Web-Video erstellen
Erzeuge die Untertitel, stelle das Format auf VTT um und lade eine .vtt-Datei herunter, die du per <track>-Element an ein HTML5-<video> anhängen kannst, um barrierefreie Wiedergabe zu ermöglichen.
Eine japanische Vorlesung in englische Untertitel übersetzen
Aktiviere vor dem Erzeugen Ins Englische übersetzen, und Whisper gibt englische Untertitel aus, die zum Originalton getimt sind – praktisch, um Vorträge mit einem breiteren Publikum zu teilen.
Häufig gestellte Fragen
- Wird mein Video auf einen Server hochgeladen?
- Nein. Beide Schritte laufen zu 100 % in deinem Browser: ffmpeg (WebAssembly) extrahiert den Ton und Whisper transkribiert ihn auf deinem Gerät. Deine Medien verlassen deinen Computer nie. Die einzige Netzwerkanfrage ist ein einmaliger Download der quelloffenen Modellgewichte von einem öffentlichen CDN.
- Welche Sprachen und Formate werden unterstützt?
- Whisper ist mehrsprachig und beherrscht über 90 Sprachen, darunter Koreanisch, Englisch, Japanisch, Chinesisch, Spanisch und mehr, mit automatischer Erkennung. Du kannst SRT, WebVTT oder ein Text-Transkript exportieren und fremdsprachige Sprache optional in englische Untertitel übersetzen.
- Welches Modell sollte ich wählen?
- Small ist die empfohlene Voreinstellung und das praktische Minimum für gutes Koreanisch und andere CJK-Sprachen. Tiny ist am schnellsten und leichtesten, aber ungenauer; Turbo (large-v3-turbo) ist am genauesten, lädt aber mehrere Hundert Megabyte herunter und läuft mit WebGPU am besten. Alle Modelle werden einmal heruntergeladen und zwischengespeichert.
- Warum ist der erste Durchlauf langsam?
- Wenn du ein Modell zum ersten Mal nutzt, werden seine Gewichte einmalig heruntergeladen (Dutzende MB bei Tiny/Small, mehr bei Turbo) und danach zwischengespeichert. Die Transkription selbst ist mit WebGPU-fähigen Browsern deutlich schneller; ohne GPU wird auf die CPU zurückgegriffen, und lange Videos können eine Weile dauern.
- Sind die Untertitel genau genug zum Veröffentlichen?
- Automatisch erzeugte Untertitel sind ein starker erster Entwurf, aber nicht perfekt – sie können Namen falsch verstehen oder bei Musik oder Stille überflüssigen Text einfügen. Deshalb ist hier jede Zeile bearbeitbar: Prüfe und korrigiere das Transkript, bevor du es herunterlädst, besonders bei Barrierefreiheit.
- Gibt es eine Dateigrößenbeschränkung?
- Alles läuft im Arbeitsspeicher deines Browsers, daher können sehr große oder sehr lange Dateien langsam sein oder den Speicher überlasten. Dateien über etwa 500 MB zeigen eine Warnung, und Dateien über 2 GB werden blockiert. Bei langen Aufnahmen helfen ein kürzerer Clip oder ein kleineres Modell.
Verwandte Tools
Bildformat-Konverter
Konvertiere Bilder vollständig im Browser zwischen AVIF, WebP, PNG, JPEG, BMP, ICO und Einzelbild-GIF.
Excel/CSV zu JSON
Wandle eine Excel- oder CSV-Tabelle direkt im Browser in JSON oder CSV um.
EXIF-Viewer & Metadaten-Entferner
Sieh dir die EXIF-Metadaten eines Bildes an – Kamera, Objektiv, Aufnahmedatum und GPS-Standort – entferne dann jeden Tag und lade eine saubere Kopie herunter, alles in deinem Browser.
Favicon-Generator
Erstelle im Browser ein komplettes Favicon-Paket: eine echte Multi-Resolution-favicon.ico, PNGs von 16 bis 512 px, eine site.webmanifest und ein HTML-Snippet.