Тихая революция: китайская нейросеть DeepSeek R1 бесплатная, без VPN и лучше ChatGPT
На рынке нейросетей лидерство традиционно удерживает компания OpenAI. Но 20 января 2025 года ситуация кардинально изменилась. На р��нке появилась новая open source языковая модель DeepSeek R1, которая дает результаты на уровне OpenAI o1, при этом в 4 раза быстрее, имеет доступ к интернету и умеет работать с документами.
В своей колонке расскажу, почему же DeepSeek R1 может поменять восприятие доступных в России нейросетей и какое влияние окажет на отечественный бизнес.
Если хотите глубже разобраться в китайских нейросетях, в эту пятницу проведу эфир, где разберу все последние новинки и покажу, чем они отличаются от западных аналогов.
С момента выпуска публичной версии ChatGPT компания стабильно предлагает инновационные решения: доступ в интернет, сторонние плагины, работу с документами и изображениями прямо в чате, расширенные контекстные окна. А в конце 2024 года OpenAI представила модель o1, а позже и o3, способную размышлять и решать сложные задачи. Это стало значительным шагом в направлении AGI (общего искусственного интеллекта), который способен выполнять широкий спектр задач лучше человека. Однако использование технологий OpenAI в России остаётся проблематичным. OpenAI официально недоступна в стране, оплатить её услуги невозможно, а боты-посредники часто ограничивают функционал.
DeepSeek-AI (深度求索), китайская компания, специализирующаяся на больших языковых моделях (LLM) и передовых AI-технологиях, представила революционную модель DeepSeek-R1. Эта модель выделяется выдающимися способностями к логическому мышлению, математическим вычислениям и программированию. Производительность DeepSeek-R1 сравнима с OpenAI o1-1217, устанавливая новый стандарт для открытых AI-решений.
Рекорды на международных тестах
DeepSeek-R1, обученная исключительно методом обучения с подкреплением (RL), демонстрирует впечатляющие результаты:
- AIME 2024: 71% точности (86,7% с методом majority voting);
- MATH-500: 97,3%;
- Codeforces: 96,3% процентиль;
- MMLU: 90,8%.
Эти результаты ставят её в один ряд с лучшими моделями OpenAI. Я сравнил модель OpenAI o1 и DeepSeek-R1 на решении последней задаче с демо-версии ЕГЭ 2024 года по профильной математике. Обе модели справились, однако DeepSeek потребовалось 138 секунд, тогда как OpenAI o1 справилась за 8 минут и 22 секунды. Решение задачи скрыто в рассуждениях.
Результаты более детального сравнения, которая предоставляет сама компания в своем исследовании:
Доступность и практичность
Пройдемся по ключевым преимуществам.
Прежде всего, это открытость исходного кода и весов модели. Благодаря этому, разработчики со всего мира могут работать над улучшением технологий, что позволяет развёртывать модель локально в безопасной инфраструктуре. А для реалий, в которых работают российские компании, это крайне важно.
Модель доступна в шести дистиллированных версиях (1,5B, 7B, 8B, 14B, 32B, 70B), основанных на архитектурах Qwen и Llama, которые можно запускать на локальных компьютерах. Даже компактная версия DeepSeek-R1-7B превосходит GPT-4o в математических задачах.
Для личного использования модель предоставляется бесплатно через сайт chat.deepseek.com, доступный из России.
Для разработчиков, которые используют API языковой модели для интеграции в сервисы доступны 2 модели: DeepSeek R1 (модель с размышлением, аналог OpenAI o1) и DeepSeek V3 (аналог GPT-4o). Стоимость токенов в среднем в 6 раз дешевле, чем у OpenAI.
Инновационный поиск и работа с данными
В режиме чата DeepSeek умеет искать информацию в интернете и анализировать найденные материалы. В отличие от конкурентов, как тот же ChatGPT 4o, GigaChat, Yandex 4, Сlaude 3.5, она обрабатывает больше данных за меньшее время, что делает её незаменимой для аналитиков и исследователей.
Почему выход DeepSeek R1 – это тихая революция
Я уже вижу, протестировав DeepSeek-R1 за пару дней, что ее появление знаменует новую эру в мире искусственного интеллекта. Эта модель не только демонстрирует передовые технологические достижения, но и меняет правила игры для пользователей, особенно в регионах с ограниченным доступом к зарубежным сервисам, таких как Россия или Китай. Бесплатное использование, локальное развёртывание и невероятная производительность делают её идеальным инструментом для бизнеса и научных исследований.
DeepSeek-R1 показывает, что инновации могут быть доступными и демократичными. Это не просто конкурент OpenAI — это новый этап в эволюции искусственного интеллекта, который уже сейчас приносит ощутимую пользу пользователям по всему миру. Такой же позиции придерживаются и западные эксперты в медиа, и популяризаторы нейросетей в социальных сетях.