Что это

Open-source модель для клонирования голоса от Coqui. Хватит 6 секунд аудио — и XTTS-v2 скопирует голос и заговорит на любом из поддерживаемых языков, включая русский. Никакого долгого обучения, всё из коробки.

Почему это важно

Сделала качественный voice cloning доступным без дата-центров и корпоративных бюджетов. Энтузиасты докрутили русский язык до вменяемого уровня, что открывает дорогу к голосовым AI-ботам, NPC в играх и персонализированным ассистентам.

Моя точка входа

В январе 2025 рассматривал XTTS-v2 как один из двух реальных вариантов TTS для русского языка (второй — Silero TTS). Подключается к Voxta или SillyTavern для сборки голосовых AI-ботов. При этом грань между «весёлым экспериментом» и «Black Mirror-ной крипотой» уже весьма тонкая.

Источники