Кейсы для Operator
Давеча в одном чате спросили, казалось бы, простую штуку «Есть видео, есть его название и описание. Нужно загрузить на 4 платформы: YouTube Shorts, VK Клипы, Дзен и Telegram. Вручную скучно».
Задачу нужно решить максимально удобным для пользователя без склонностей к скриптам и опен-сорсу. Простая идея, которая возникнет у вас — есть же какие-то готовые сервисы для SMMщиков, планировать посты в нескольких местах. Простая идея, которая возникла бы у меня без слов «ВК» и «Дзен» — идёшь в make.com и собираешь простой воркфлоу кросс-постинга.
Далее ты выясняешь, что в одном сервисе нет поддержки одной соцсети, а в другом — другой. Т.е. плати в 2 разных места чтобы всё ещё не решить задачу в одном месте. Мы можем генерировать контент для этих соцсетей GenAI-инструментами, но постить везде всё равно нужно кому-то кожаному за денежку?
В контексте ИИ-агентов (процессов, управляемыми и инициируемыми LLM), хочется решить задачу так: ты сказал голосом своим Apple Watch «Вот там-то есть видео, запости как обычно» и всё случается. На крайний случай открыл приложение/веб, сформулировал задачу на естественном языке и ушёл радоваться».
Идёт уже третий месяц «Года агентов», но массовый пользователь ещё не получил удобных и доступных инструментов. И не понимает, что с ними делать, когда получит. Например, самый наглядный Operator от OpenAI всё ещё в подписке за 200 долларов. Да, есть browser-use, который я периодически открываю и смотрю как парень подтягивается и пытается, но ты объясни кому-то как его открыть и использовать даже с Pinokio. И это не специально дообученная мультимодальная моделька где-то в облаке и каким-то UI/UX. Для меня, кстати, облачность Оператора выглядит скорее минусом. В browser-use можно указать свой Chrome со всеми авторизациями и куки. Чтоб отправлять остроумничать где-нибудь в Интернете со своей учётки. Ну или заказывать сырники из Самоката. Но мы не об этом.
Кажется, что прямо сегодня решить проблему пользователя с заливкой видео в несколько мест включая непопулярные БЕЗ всех этих API, Playwright`ов может…что-то для захвата действий клавиатуры и мыши, типа Automator на MacOS. Но принцип примерно похожий: сходи циклом в табличку, в А1 — название, в А2 — описание, самый верхний файл в этой папке загружаем на страницу аплоада, повторяем для нескольких сайтов, удаляем строку из таблицы и верхний файл из папки, идём снова в табличку смотреть есть ли что.
С другой стороны, чуваки с Pro-подпиской уже тестируют новые бизнес-идеи. Отправляешь Operator на местное Авито искать объявления «Отдаю пианино, бесплатно, самовывоз», списываться с продавцами и заносить в табличку. Потом ищешь там же людей, которые готовы купить пианино, если им его доставят. Остаётся добавить в цепочку транспортную компанию, всех скоординировать и передать маржу промпт-инженеру. Вот такой заработок на нейросетях мы заслужили!
t.me/staniverse/474* · 3 мар 2025*