Что это
Vosk — это открытый speech-to-text движок, который работает полностью офлайн. Есть модели разных калибров: компактные (~50 МБ) для смартфонов и Raspberry Pi, и потяжелее для десктопов и серверов. Русский язык поддерживается из коробки.
Почему это важно
Лёгкая альтернатива Whisper, когда железо не тянет тяжёлые модели или нужна работа на слабых устройствах. Удобно встраивается в пайплайны — например, для автосубтитров в Subtitle Edit с разбиением на тайм-коды и попыткой расставить пунктуацию.
Моя точка входа
Рекомендовал как более лёгкую альтернативу Whisper для коротких фраз при сборке AI-голосового бота. Также использовал через Subtitle Edit для автоматического транскрибирования видео с тайм-кодами.