Question 1

Apakah video saya diunggah ke server?

Accepted Answer

Tidak. Kedua langkah berjalan 100% di browser Anda: ffmpeg (WebAssembly) mengekstrak audio dan Whisper mentranskripsinya di perangkat Anda. Media Anda tidak pernah meninggalkan komputer. Satu-satunya permintaan jaringan adalah pengunduhan sekali bobot model sumber terbuka dari CDN publik.

Question 2

Bahasa dan format apa saja yang didukung?

Accepted Answer

Whisper bersifat multibahasa dan menangani 90+ bahasa, termasuk Korea, Inggris, Jepang, Mandarin, Spanyol, dan lainnya, dengan deteksi otomatis. Anda bisa mengekspor SRT, WebVTT, atau transkrip teks biasa, dan secara opsional menerjemahkan ucapan non-Inggris menjadi subtitel bahasa Inggris.

Question 3

Model mana yang sebaiknya saya pilih?

Accepted Answer

Small adalah bawaan yang disarankan sekaligus batas minimum praktis untuk hasil Korea dan bahasa CJK lainnya yang baik. Tiny paling cepat dan paling ringan tetapi kurang akurat; Turbo (large-v3-turbo) paling akurat tetapi mengunduh beberapa ratus megabita dan bekerja paling baik dengan WebGPU. Semua model diunduh sekali lalu disimpan di cache.

Question 4

Kenapa proses pertama lambat?

Accepted Answer

Saat pertama kali memakai sebuah model, bobotnya diunduh sekali (puluhan MB untuk Tiny/Small, lebih untuk Turbo) lalu disimpan di cache untuk berikutnya. Transkripsinya sendiri jauh lebih cepat di browser yang mendukung WebGPU; tanpa GPU, prosesnya beralih ke CPU dan video panjang bisa memakan waktu.

Question 5

Apakah subtitelnya cukup akurat untuk diterbitkan?

Accepted Answer

Subtitel yang dibuat otomatis adalah draf awal yang kuat, tetapi tidak sempurna — bisa salah dengar nama atau menambahkan teks nyasar pada musik atau keheningan. Karena itu setiap baris di sini bisa diedit: tinjau dan perbaiki transkripnya sebelum Anda mengunduh, terutama untuk aksesibilitas.

Question 6

Apakah ada batasan ukuran berkas?

Accepted Answer

Semuanya berjalan di memori browser Anda, sehingga berkas yang sangat besar atau sangat panjang bisa lambat atau kehabisan memori. Berkas di atas sekitar 500 MB menampilkan peringatan dan berkas di atas 2 GB diblokir. Untuk rekaman panjang, klip yang lebih pendek atau model yang lebih kecil bisa membantu.

Video ke Subtitel (Ucapan ke Teks)

Apa itu Video ke Subtitel (Ucapan ke Teks)?

Cara menggunakan Video ke Subtitel (Ucapan ke Teks)

Contoh

Beri subtitel wawancara berbahasa Korea sebagai berkas SRT

Buat subtitel WebVTT untuk video web

Terjemahkan kuliah berbahasa Jepang menjadi subtitel bahasa Inggris

Pertanyaan yang sering diajukan

Alat terkait

Konverter Format Gambar

Excel/CSV ke JSON

Penampil EXIF & Penghapus Metadata

Generator Favicon