Whisper – десятки нейросетей и сервисов для создания сабов, проставления таймкодов, расшифровки созвонов и решения любых сопутствующих задач
Умения:
—Расшифрока аудио в текст
—Печать текста под диктовку с глобальным захватом речи;
—Транскрибация аудио и видео в реальном времени вместе со смарт-заметками;
—Перевод аудио и видео, а также перевод в лайве;
—Автосубтитры для видео;
—Сабы для Ютуб-видео;
—Диаризация – распознавание речи даже десятки спикеров;
—Контроль качества распознавания
—Распознавание различных звуков, шумов и прочего аудио, не связанного с речью;
—Интеграция в любые ваши программы.
Главное, все тулзы можно захостить самому, даже на слабом железе и юзать только локально.
Источник – https://github.com/sindresorhus/awesome-whisper/