Что это
Платформа-оркестратор для создания голосовых AI-компаньонов. Собирает в один пайплайн сервисы распознавания речи (STT), языковые модели (LLM) и генерации голоса (TTS) — каждый компонент можно выбрать и подключить самостоятельно. Похожа на SillyTavern, но заточена именно под голосовое взаимодействие.
Почему это важно
Даёт полный контроль над всем стеком: от модели для текста до голоса, которым говорит персонаж. Интегрируется с Live2D, VRM-аватарами и интерактивными приложениями вроде Virt-A-Mate. По сути — швейцарский нож для оживления AI-персонажей с любым набором сервисов.
Моя точка входа
Использовал в связке с бесплатной Gemini 2.0 Flash через OpenRouter для текста, рассматривал ElevenLabs для генерации голоса. Показывал в видеоуроке как часть ecosystem для AI-NPC: от простых чатботов до агентских фреймворков.