Video ke Subtitel (Ucapan ke Teks)
Buat subtitel SRT, VTT, atau teks biasa dari video atau audio apa pun dengan mentranskripsi ucapannya secara lokal di browser menggunakan Whisper — tanpa unggahan.
Video ke Subtitel (Ucapan ke Teks) — Ubah suara ucapan dalam video menjadi subtitel siap pakai tanpa mengunggah apa pun. Jatuhkan berkas MP4, MOV, WebM, MKV, atau audio, lalu alat ini mengekstrak suaranya, menjalankan model pengenalan ucapan Whisper dari OpenAI langsung di dalam browser Anda, dan menghasilkan subtitel SRT, WebVTT, atau teks biasa berstempel waktu yang bisa Anda edit dan unduh. Audio tidak pernah meninggalkan perangkat Anda — hanya bobot model sumber terbuka yang diambil sekali dari CDN publik — sehingga rekaman Anda tetap sepenuhnya privat.
Apa itu Video ke Subtitel (Ucapan ke Teks)?
Pembuat subtitel video gratis dan privat yang mentranskripsi ucapan menjadi teks berstempel waktu sepenuhnya di dalam browser Anda. Alat ini memakai ffmpeg yang dikompilasi ke WebAssembly untuk menarik audio 16 kHz dari video, lalu menjalankan model Whisper multibahasa (lewat WebGPU bila tersedia, jika tidak lewat CPU) untuk mengenali ucapan dan menempatkannya pada linimasa. Kreator, editor, pelajar, dan tim aksesibilitas memakainya untuk memberi subtitel pada wawancara, kuliah, tutorial, dan klip media sosial dalam 90+ bahasa — termasuk Korea, Jepang, dan Mandarin — serta mengekspor SRT untuk editor video, WebVTT untuk web, atau transkrip teks yang rapi. Pilih ukuran model untuk menyeimbangkan kecepatan dan akurasi, deteksi bahasa otomatis atau tetapkan sendiri, terjemahkan ucapan ke bahasa Inggris bila perlu, lalu perbaiki baris mana pun di editor bawaan sebelum mengunduh.
Cara menggunakan Video ke Subtitel (Ucapan ke Teks)
- Seret berkas video atau audio ke area jatuhkan, atau klik untuk memilihnya. Tidak ada yang diunggah — berkas dibaca secara lokal.
- Pilih model: Tiny untuk kecepatan, Small untuk keseimbangan (disarankan), atau Turbo untuk akurasi terbaik. Model yang lebih besar mengunduh lebih banyak data saat pertama kali dipakai.
- Biarkan bahasa pada Deteksi otomatis, atau pilih bahasa yang diucapkan untuk meningkatkan akurasi. Aktifkan Terjemahkan ke bahasa Inggris jika Anda ingin subtitel Inggris dari ucapan berbahasa lain.
- Tekan Buat subtitel. Pada proses pertama, model diunduh sekali (lalu disimpan di cache); audio diekstrak dan ditranskripsi di dalam browser Anda.
- Pilih SRT, VTT, atau Teks, edit baris mana pun untuk memperbaiki kata-kata, pratinjau subtitel pada video, lalu unduh berkas subtitelnya.
Contoh
Beri subtitel wawancara berbahasa Korea sebagai berkas SRT
Jatuhkan klipnya, biarkan model pada Small (atau Turbo untuk hasil Korea yang lebih bersih), biarkan bahasa pada Deteksi otomatis, lalu ekspor berkas .srt berstempel waktu untuk dimuat ke editor video Anda.
Buat subtitel WebVTT untuk video web
Buat subtitel, ganti formatnya ke VTT, lalu unduh berkas .vtt yang bisa Anda lampirkan ke elemen <video> HTML5 dengan elemen <track> untuk pemutaran yang aksesibel.
Terjemahkan kuliah berbahasa Jepang menjadi subtitel bahasa Inggris
Aktifkan Terjemahkan ke bahasa Inggris sebelum membuat subtitel, dan Whisper menghasilkan subtitel bahasa Inggris yang selaras dengan waktu ucapan aslinya — praktis untuk berbagi ceramah dengan audiens yang lebih luas.
Pertanyaan yang sering diajukan
- Apakah video saya diunggah ke server?
- Tidak. Kedua langkah berjalan 100% di browser Anda: ffmpeg (WebAssembly) mengekstrak audio dan Whisper mentranskripsinya di perangkat Anda. Media Anda tidak pernah meninggalkan komputer. Satu-satunya permintaan jaringan adalah pengunduhan sekali bobot model sumber terbuka dari CDN publik.
- Bahasa dan format apa saja yang didukung?
- Whisper bersifat multibahasa dan menangani 90+ bahasa, termasuk Korea, Inggris, Jepang, Mandarin, Spanyol, dan lainnya, dengan deteksi otomatis. Anda bisa mengekspor SRT, WebVTT, atau transkrip teks biasa, dan secara opsional menerjemahkan ucapan non-Inggris menjadi subtitel bahasa Inggris.
- Model mana yang sebaiknya saya pilih?
- Small adalah bawaan yang disarankan sekaligus batas minimum praktis untuk hasil Korea dan bahasa CJK lainnya yang baik. Tiny paling cepat dan paling ringan tetapi kurang akurat; Turbo (large-v3-turbo) paling akurat tetapi mengunduh beberapa ratus megabita dan bekerja paling baik dengan WebGPU. Semua model diunduh sekali lalu disimpan di cache.
- Kenapa proses pertama lambat?
- Saat pertama kali memakai sebuah model, bobotnya diunduh sekali (puluhan MB untuk Tiny/Small, lebih untuk Turbo) lalu disimpan di cache untuk berikutnya. Transkripsinya sendiri jauh lebih cepat di browser yang mendukung WebGPU; tanpa GPU, prosesnya beralih ke CPU dan video panjang bisa memakan waktu.
- Apakah subtitelnya cukup akurat untuk diterbitkan?
- Subtitel yang dibuat otomatis adalah draf awal yang kuat, tetapi tidak sempurna — bisa salah dengar nama atau menambahkan teks nyasar pada musik atau keheningan. Karena itu setiap baris di sini bisa diedit: tinjau dan perbaiki transkripnya sebelum Anda mengunduh, terutama untuk aksesibilitas.
- Apakah ada batasan ukuran berkas?
- Semuanya berjalan di memori browser Anda, sehingga berkas yang sangat besar atau sangat panjang bisa lambat atau kehabisan memori. Berkas di atas sekitar 500 MB menampilkan peringatan dan berkas di atas 2 GB diblokir. Untuk rekaman panjang, klip yang lebih pendek atau model yang lebih kecil bisa membantu.
Alat terkait
Konverter Format Gambar
Konversi gambar antara AVIF, WebP, PNG, JPEG, BMP, ICO, dan GIF bingkai tunggal sepenuhnya di browser Anda.
Excel/CSV ke JSON
Konversi spreadsheet Excel atau CSV menjadi JSON atau CSV langsung di browser Anda.
Penampil EXIF & Penghapus Metadata
Lihat metadata EXIF sebuah gambar — kamera, lensa, tanggal pengambilan, dan lokasi GPS — lalu hapus setiap tag dan unduh salinan bersih, semuanya di browser Anda.
Generator Favicon
Buat paket favicon lengkap di browser Anda: favicon.ico multiresolusi asli, PNG 16 hingga 512 px, site.webmanifest, dan cuplikan HTML.