Question 1

Чи завантажується моє відео на сервер?

Accepted Answer

Ні. Обидва етапи виконуються на 100 % у вашому браузері: ffmpeg (WebAssembly) витягує звук, а Whisper розпізнає його на вашому пристрої. Ваші файли не залишають комп'ютер. Єдиний мережевий запит — одноразове завантаження ваг відкритої моделі з публічного CDN.

Question 2

Які мови й формати підтримуються?

Accepted Answer

Whisper — багатомовна модель, вона працює з понад 90 мовами, включно з корейською, англійською, японською, китайською, іспанською та іншими, з автовизначенням. Можна експортувати SRT, WebVTT або звичайну текстову розшифровку, а за бажанням перекласти мовлення не англійською в англійські субтитри.

Question 3

Яку модель обрати?

Accepted Answer

Small — рекомендований варіант за замовчуванням і практичний мінімум для доброї корейської та інших мов CJK. Tiny найшвидша й найлегша, але менш точна; Turbo (large-v3-turbo) найточніша, але завантажує кілька сотень мегабайтів і найкраще працює з WebGPU. Усі моделі завантажуються один раз і кешуються.

Question 4

Чому перший запуск повільний?

Accepted Answer

Під час першого використання моделі її ваги завантажуються один раз (десятки MB для Tiny/Small, більше для Turbo), а потім беруться з кешу. Саме розпізнавання йде значно швидше у браузерах із підтримкою WebGPU; без GPU воно перемикається на CPU, і довгі відео можуть оброблятися довго.

Question 5

Чи достатньо точні субтитри для публікації?

Accepted Answer

Автоматичні субтитри — хороший чорновик, але не ідеал: вони можуть неправильно розчути імена або додати зайвий текст на музиці чи в тиші. Тому тут можна редагувати кожен рядок: перевірте й виправте розшифровку перед завантаженням, особливо якщо це потрібно для доступності.

Question 6

Чи є обмеження на розмір файлу?

Accepted Answer

Усе працює в пам'яті браузера, тож дуже великі або дуже довгі файли можуть оброблятися повільно чи впертися в нестачу пам'яті. Файли понад приблизно 500 MB показують попередження, а файли понад 2 GB блокуються. Для довгих записів допомагає коротший кліп або менша модель.

Відео в субтитри (розпізнавання мовлення)

Що таке Відео в субтитри (розпізнавання мовлення)?

Як користуватися Відео в субтитри (розпізнавання мовлення)

Приклади

Субтитри до корейського інтерв'ю у файлі SRT

Субтитри WebVTT для вебвідео

Переклад японської лекції в англійські субтитри

Поширені запитання

Схожі інструменти

Конвертер форматів зображень

Excel/CSV у JSON

Перегляд EXIF і видалення метаданих

Генератор фавіконів