Что это

Открытые модели текст-в-речь от команды Silero, которые работают на 20 языках с сотнями голосов. Репозиторий на GitHub набрал 6K звёзд — для TTS-проекта это серьёзная заявка. Есть удобная обёртка на PyPI для быстрого вызова из кода или консоли.

Почему это важно

Одно из лучших бесплатных решений для синтеза русской речи на январь 2025. Не идеальное, но энтузиасты довели качество до вполне юзабельного уровня. Клонирование голоса есть — и тут стоит помнить про грань между «весёлый эксперимент» и «крипота из Black Mirror».

Моя точка входа

Рассматривал как один из двух вариантов TTS для пайплайна AI-голосового бота на арендованном GPU. Альтернатива — XTTS-v2. Обе модели неплохо справляются с русским.

Источники