↩ Реплай на: «DeepSeek is a side project: что было дальше» — https://t.me/staniverse/411
**
Если верить Wiz Research (компания занимается кибербезопасностью), у DeepSeek кроме проблем с доступностью в последние дни могла случиться утечка данных. Чаты пользователей, API-ключи и кто знает что ещё хранилось в БД ClickHouse БЕЗ ПАРОЛЯ. Опять же, есть мы верим источнику, то они это нашли, передали информацию в Китай и те всё пофиксили. А был ли мальчик? Ну хоть CEO ClickHouse в бывшем Твиттере полезные советы по использованию своего решения даёт.
В предыдущей серии (вчера) представитель Трампа по ИИ вкинул новость, что OpenAI c Microsoft снова дружат предъявляют DeepSeek за несамостоятельность обучения своих моделей. Якобы это всё «дистилляция» GPT, т.е. обучение на выводе другой модели.
OpenAI, конечно же, никогда не использовали ничьи данные, не нарушали авторских прав и вообще милашки. И все-все вместе не достигли в какой-то момент потолка по имеющимся данным для обучения и не стали использовать «синту» т.е. синтетические данные для обучения.
Чуть не забыл. CEO Antрropic написал в блоге большой пост про DeepSeek. Говорит результаты у китайцев хорошие при меньших затратах, но это скорее ожидаемый прогресс, чем революционный прорыв. DeepSeek «не делает за $6 млн то, что стоило американским компаниям миллиарды», ведь нужно учитывать стоимость оборудования и R&D. Но при этом нужен экспортный контроль, для предотвращения получения Китаем большого количества передовых чипов.
t.me/staniverse/415* · 30 янв 2025*