Лаборатория в Китае, подарившая нам DeepSeek — герои месяца

CEO DeepSeek Лиан Венфенг давеча встретился со вторым лицом Китая, после релиза большой языковой модели с reasoning R1. Ну, встретились и встретились мужчины, казалось бы, но погодите.

У команды DeepSeek с сильно меньшими ресурсами, чем у OpenAI/Antropic получилось представить модели достойные конкурентов (недавно была v3, сейчас «рассуждающая» R1), с открытыми весами (можно бесплатно в коммерческих целях, хостить в закрытом контуре), доступом по API в разы дешевле OpenAI’шного и бесплатно через сайт. Для нашего региона это ещё и отсутствие геморроев с блокировками.

У исследователей теперь есть paper «Как делаются рассуждающие модели такого уровня» (проприетарщина таким не делится). У энтузиастов на домашних ПК — дистилляты с меньшими весами. Всё лежит по ссылке.

Цитата из анонса R1 🏆:
Pushing the boundaries of open AI!

Про встречу. Добавляет этому всему перчинку ИИ-гонка между США и Китаем. Первые не хотят уступить вторым и пытаются как-то ограничить в использовании своих технологий, даже видеокарта NVIDIA RTX 5090 там будет особенная, с ограничениями на ИИ.

От какого Сэма больше ждём ответа: Альтмана или который Дядюшка?
20250121_DeepSeek-как-side-project-встряхнул

t.me/staniverse/395* · 21 янв 2025*