Что это

Платформа-оркестратор для создания голосовых AI-компаньонов. Собирает в один пайплайн сервисы распознавания речи (STT), языковые модели (LLM) и генерации голоса (TTS) — каждый компонент можно выбрать и подключить самостоятельно. Похожа на SillyTavern, но заточена именно под голосовое взаимодействие.

Почему это важно

Даёт полный контроль над всем стеком: от модели для текста до голоса, которым говорит персонаж. Интегрируется с Live2D, VRM-аватарами и интерактивными приложениями вроде Virt-A-Mate. По сути — швейцарский нож для оживления AI-персонажей с любым набором сервисов.

Моя точка входа

Использовал в связке с бесплатной Gemini 2.0 Flash через OpenRouter для текста, рассматривал ElevenLabs для генерации голоса. Показывал в видеоуроке как часть ecosystem для AI-NPC: от простых чатботов до агентских фреймворков.

Источники