Что это
Открытый фреймворк для быстрого файнтюнинга больших языковых моделей — Llama, Mistral, Gemma и других. Спроектирован так, чтобы дообучение работало в разы быстрее и ело меньше памяти, чем стандартные подходы. Запускается даже на одной RTX 3090.
Почему это важно
Снижает порог входа в кастомизацию AI до уровня «арендовал GPU на пару часов за 400 рублей — получил свою модель». Для инди-проектов, экспериментов с цифровыми двойниками и голосовыми ботами это буквально инструмент-проводник между «хочу свою модель» и «она работает у меня локально».
Моя точка входа
Рекомендовал как конкретный рабочий инструмент для файнтюнинга instruct-моделей Llama/Mistral при создании цифровых двойников (октябрь 2024) и сборке AI-голосового бота на арендованном GPU (январь 2025).