Videodan Altyazı (Konuşmayı Metne Dönüştürme)

Herhangi bir video veya sesteki konuşmayı Whisper ile doğrudan tarayıcınızda yazıya dökerek SRT, VTT veya düz metin altyazıları oluşturun — hiçbir yükleme yapmadan.

Araç yükleniyor…

Videodan Altyazı (Konuşmayı Metne Dönüştürme)Bir videonun konuşma sesini hiçbir şey yüklemeden kullanıma hazır altyazılara dönüştürün. Bir MP4, MOV, WebM, MKV veya ses dosyası bırakın; bu araç sesi çıkarır, OpenAI'nin Whisper konuşma tanıma modelini doğrudan tarayıcınızın içinde çalıştırır ve düzenleyip indirebileceğiniz, zaman damgalı SRT, WebVTT veya düz metin altyazılar üretir. Ses cihazınızdan asla çıkmaz — yalnızca açık kaynak model ağırlıkları herkese açık bir CDN'den bir kez indirilir — böylece kayıtlarınız tamamen gizli kalır.

Videodan Altyazı (Konuşmayı Metne Dönüştürme) nedir?

Konuşmayı zaman damgalı altyazılara dönüştüren, tamamen tarayıcınızda çalışan ücretsiz ve gizli bir video-altyazı oluşturucu. WebAssembly'ye derlenmiş ffmpeg ile videonuzdan 16 kHz ses çıkarır, ardından çok dilli Whisper modelini (mümkünse WebGPU, değilse CPU üzerinden) çalıştırarak konuşmayı tanır ve bir zaman çizelgesine yerleştirir. İçerik üreticileri, editörler, öğrenciler ve erişilebilirlik ekipleri; röportajları, dersleri, eğitimleri ve sosyal medya kliplerini Korece, Japonca ve Çince dâhil 90'dan fazla dilde altyazılamak ve video editörleri için SRT, web için WebVTT ya da temiz bir metin dökümü olarak dışa aktarmak için kullanır. Hız ile doğruluk arasında denge kurmak için bir model boyutu seçin, dili otomatik algılatın veya kendiniz belirleyin, isterseniz konuşmayı İngilizceye çevirin, ardından indirmeden önce yerleşik düzenleyicide herhangi bir satırı düzeltin.

Videodan Altyazı (Konuşmayı Metne Dönüştürme) nasıl kullanılır

  1. Bir video veya ses dosyasını bırakma alanına sürükleyin ya da seçmek için tıklayın. Hiçbir şey yüklenmez — dosya yerel olarak okunur.
  2. Bir model seçin: hız için Tiny, denge için Small (önerilir) veya en iyi doğruluk için Turbo. Daha büyük modeller ilk kullanımda daha fazla veri indirir.
  3. Dili Otomatik algılamada bırakın ya da doğruluğu artırmak için konuşulan dili seçin. Başka dildeki konuşmadan İngilizce altyazı istiyorsanız İngilizceye çevir seçeneğini açın.
  4. Altyazı oluştur'a basın. İlk çalıştırmada model bir kez indirilir (sonra önbelleğe alınır); ses tarayıcınızda çıkarılıp yazıya dökülür.
  5. SRT, VTT veya Metin seçin, ifadeleri düzeltmek için herhangi bir satırı düzenleyin, altyazıları video üzerinde önizleyin, ardından altyazı dosyasını indirin.

Örnekler

Korece bir röportajı SRT dosyası olarak altyazılayın

Klibi bırakın, modeli Small'da (daha temiz Korece için Turbo) tutun, dili Otomatik algılamada bırakın ve video editörünüze yükleyeceğiniz zaman damgalı bir .srt dışa aktarın.

Web videosu için WebVTT altyazıları oluşturun

Altyazıları oluşturun, biçimi VTT'ye geçirin ve erişilebilir oynatma için bir HTML5 <video> öğesine <track> ile ekleyebileceğiniz bir .vtt dosyası indirin.

Japonca bir dersi İngilizce altyazıya çevirin

Oluşturmadan önce İngilizceye çevir seçeneğini açın; Whisper, özgün konuşmanın zamanlamasına uygun İngilizce altyazılar üretir — konuşmaları daha geniş bir kitleyle paylaşmak için kullanışlı.

Sıkça sorulan sorular

Videom bir sunucuya yükleniyor mu?
Hayır. Her iki adım da %100 tarayıcınızda çalışır: ffmpeg (WebAssembly) sesi çıkarır ve Whisper cihazınızda yazıya döker. Medyanız bilgisayarınızdan asla çıkmaz. Tek ağ isteği, açık kaynak model ağırlıklarının herkese açık bir CDN'den tek seferlik indirilmesidir.
Hangi diller ve biçimler destekleniyor?
Whisper çok dillidir ve Korece, İngilizce, Japonca, Çince, İspanyolca ve daha fazlası dâhil 90'dan fazla dili otomatik algılamayla işler. SRT, WebVTT veya düz metin dökümü olarak dışa aktarabilir, isteğe bağlı olarak İngilizce olmayan konuşmayı İngilizce altyazıya çevirebilirsiniz.
Hangi modeli seçmeliyim?
Small, önerilen varsayılan ve iyi Korece ile diğer CJK diller için pratikte gereken alt sınırdır. Tiny en hızlı ve en hafif olanıdır ama daha az doğrudur; Turbo (large-v3-turbo) en doğru olanıdır ancak birkaç yüz megabayt indirir ve en iyi WebGPU ile çalışır. Tüm modeller bir kez indirilip önbelleğe alınır.
İlk çalıştırma neden yavaş?
Bir modeli ilk kez kullandığınızda ağırlıkları bir kez indirilir (Tiny/Small için onlarca MB, Turbo için daha fazlası) ve sonraki sefer için önbelleğe alınır. Yazıya dökme işleminin kendisi WebGPU destekli tarayıcılarda çok daha hızlıdır; GPU yoksa CPU'ya döner ve uzun videolar biraz zaman alabilir.
Altyazılar yayımlanacak kadar doğru mu?
Otomatik oluşturulan altyazılar güçlü bir ilk taslaktır ama kusursuz değildir — isimleri yanlış duyabilir ya da müzikte veya sessizlikte gereksiz metin ekleyebilir. Bu yüzden burada her satır düzenlenebilir: özellikle erişilebilirlik için, indirmeden önce dökümü gözden geçirip düzeltin.
Dosya boyutu sınırı var mı?
Her şey tarayıcınızın belleğinde çalışır, bu yüzden çok büyük veya çok uzun dosyalar yavaş olabilir ya da belleği tüketebilir. Yaklaşık 500 MB'ı aşan dosyalar bir uyarı gösterir, 2 GB'ı aşanlar engellenir. Uzun kayıtlar için daha kısa bir klip ya da daha küçük bir model işe yarar.

İlgili araçlar