Что это
Open-source модель для клонирования голоса от Coqui. Хватит 6 секунд аудио — и XTTS-v2 скопирует голос и заговорит на любом из поддерживаемых языков, включая русский. Никакого долгого обучения, всё из коробки.
Почему это важно
Сделала качественный voice cloning доступным без дата-центров и корпоративных бюджетов. Энтузиасты докрутили русский язык до вменяемого уровня, что открывает дорогу к голосовым AI-ботам, NPC в играх и персонализированным ассистентам.
Моя точка входа
В январе 2025 рассматривал XTTS-v2 как один из двух реальных вариантов TTS для русского языка (второй — Silero TTS). Подключается к Voxta или SillyTavern для сборки голосовых AI-ботов. При этом грань между «весёлым экспериментом» и «Black Mirror-ной крипотой» уже весьма тонкая.