Тихая революция: китайская нейросеть DeepSeek R1 бесплатная, без VPN и лучше ChatGPT

На рынке нейросетей лидерство традиционно удерживает компания OpenAI. Но 20 января 2025 года ситуация кардинально изменилась. На рынке появилась новая open source языковая модель DeepSeek R1, которая дает результаты на уровне OpenAI o1, при этом в 4 раза быстрее, имеет доступ к интернету и умеет работать с документами.

В своей колонке расскажу, почему же DeepSeek R1 может поменять восприятие доступных в России нейросетей и какое влияние окажет на отечественный бизнес.

Если хотите глубже разобраться в китайских нейросетях, в эту пятницу проведу эфир, где разберу все последние новинки и покажу, чем они отличаются от западных аналогов.

С момента выпуска публичной версии ChatGPT компания стабильно предлагает инновационные решения: доступ в интернет, сторонние плагины, работу с документами и изображениями прямо в чате, расширенные контекстные окна. А в конце 2024 года OpenAI представила модель o1, а позже и o3, способную размышлять и решать сложные задачи. Это стало значительным шагом в направлении AGI (общего искусственного интеллекта), который способен выполнять широкий спектр задач лучше человека. Однако использование технологий OpenAI в России остаётся проблематичным. OpenAI официально недоступна в стране, оплатить её услуги невозможно, а боты-посредники часто ограничивают функционал.

DeepSeek-AI (深度求索), китайская компания, специализирующаяся на больших языковых моделях (LLM) и передовых AI-технологиях, представила революционную модель DeepSeek-R1. Эта модель выделяется выдающимися способностями к логическому мышлению, математическим вычислениям и программированию. Производительность DeepSeek-R1 сравнима с OpenAI o1-1217, устанавливая новый стандарт для открытых AI-решений.

Рекорды на международных тестах

DeepSeek-R1, обученная исключительно методом обучения с подкреплением (RL), демонстрирует впечатляющие результаты:

  • AIME 2024: 71% точности (86,7% с методом majority voting);
  • MATH-500: 97,3%;
  • Codeforces: 96,3% процентиль;
  • MMLU: 90,8%.

Эти результаты ставят её в один ряд с лучшими моделями OpenAI. Я сравнил модель OpenAI o1 и DeepSeek-R1 на решении последней задаче с демо-версии ЕГЭ 2024 года по профильной математике. Обе модели справились, однако DeepSeek потребовалось 138 секунд, тогда как OpenAI o1 справилась за 8 минут и 22 секунды. Решение задачи скрыто в рассуждениях.

14 задача из 2 части демо-версии ЕГЭ 2024, профильный уровень
14 задача из 2 части демо-версии ЕГЭ 2024, профильный уровень
Решение задачи моделью DeepSeek R1. Ответ верный, время размышления - 138 секунд. Ту же задачу OpenAI o1 решала 8 минут 22 секунды.
Решение задачи моделью DeepSeek R1. Ответ верный, время размышления - 138 секунд. Ту же задачу OpenAI o1 решала 8 минут 22 секунды.

Результаты более детального сравнения, которая предоставляет сама компания в своем исследовании:

Сравнение DeepSeek R1 и моделей OpenAI
Сравнение DeepSeek R1 и моделей OpenAI

Доступность и практичность

Пройдемся по ключевым преимуществам.

Прежде всего, это открытость исходного кода и весов модели. Благодаря этому, разработчики со всего мира могут работать над улучшением технологий, что позволяет развёртывать модель локально в безопасной инфраструктуре. А для реалий, в которых работают российские компании, это крайне важно.

Модель доступна в шести дистиллированных версиях (1,5B, 7B, 8B, 14B, 32B, 70B), основанных на архитектурах Qwen и Llama, которые можно запускать на локальных компьютерах. Даже компактная версия DeepSeek-R1-7B превосходит GPT-4o в математических задачах.

Тихая революция: китайская нейросеть DeepSeek R1 бесплатная, без VPN и лучше ChatGPT

Для личного использования модель предоставляется бесплатно через сайт chat.deepseek.com, доступный из России.

Тихая революция: китайская нейросеть DeepSeek R1 бесплатная, без VPN и лучше ChatGPT

Для разработчиков, которые используют API языковой модели для интеграции в сервисы доступны 2 модели: DeepSeek R1 (модель с размышлением, аналог OpenAI o1) и DeepSeek V3 (аналог GPT-4o). Стоимость токенов в среднем в 6 раз дешевле, чем у OpenAI.

Тихая революция: китайская нейросеть DeepSeek R1 бесплатная, без VPN и лучше ChatGPT

Инновационный поиск и работа с данными

В режиме чата DeepSeek умеет искать информацию в интернете и анализировать найденные материалы. В отличие от конкурентов, как тот же ChatGPT 4o, GigaChat, Yandex 4, Сlaude 3.5, она обрабатывает больше данных за меньшее время, что делает её незаменимой для аналитиков и исследователей.

Почему выход DeepSeek R1 – это тихая революция

Я уже вижу, протестировав DeepSeek-R1 за пару дней, что ее появление знаменует новую эру в мире искусственного интеллекта. Эта модель не только демонстрирует передовые технологические достижения, но и меняет правила игры для пользователей, особенно в регионах с ограниченным доступом к зарубежным сервисам, таких как Россия или Китай. Бесплатное использование, локальное развёртывание и невероятная производительность делают её идеальным инструментом для бизнеса и научных исследований.

DeepSeek-R1 показывает, что инновации могут быть доступными и демократичными. Это не просто конкурент OpenAI — это новый этап в эволюции искусственного интеллекта, который уже сейчас приносит ощутимую пользу пользователям по всему миру. Такой же позиции придерживаются и западные эксперты в медиа, и популяризаторы нейросетей в социальных сетях.

15
4
23 комментария

Я тестировал DeepSeek (чат) и GPT 4о. По смыслам и стилю написания у GPT текст выходит лучше. Он хорошо воспринимает прописанную стилистику и более четко следует инструкциям.
Собираю логику с участием нейронки на make. Думал перейти на DeepSeek, но после тестов отказался пока что от этой идеи.
Но, в целом, китайская версия тоже интересная и подойдет для каких-то простых задач и для тех, кто не может получить доступ к GPT.

2

С русским текстом лучше всего работали модели anthropic (sonnet/opus) и Google Gemini (лучше 2 версии).

Следование инструкциям круче всего у sonnet.

Но r1 отлично пишет код. Если использовать aider - то r1+sonnet новая sota.

3

Когда проверяли? R1 презентовали 20 января

Кирилл, я прям вижу, что текст статьи написан при помощи нейросети :)

1

Текст написал человеком, редактура нейросети )

Пробовал доработку/оптимизацию вычислений на HLSL/GLSL - сложная задача без визуального представления и тестов, 4о дает достаточно неплохие рекомендации и правки будто "вникая", пускай и не всегда на 100% точно, DeepSeek вообще не может понять, что от неё требуется, пытаясь "прикостелить" примеры из базовых учебников, так что пока всё очень и очень шатко, с текстами, как писалось выше, тоже всё пока не так гладко как хотелось бы

1

Вы режим DeepThink использовали?