Нейросеть DeepSeek: что умеет и как конкурирует с ChatGPT

Китайские модели кодят, «говорят» на русском и зарождают сомнения в эффективности крупных вложений в ИИ.

В январе 2025 года китайская нейросеть DeepSeek сдвинула чат-бот компании OpenAI с пьедестала: обогнала ChatGPT по количеству скачиваний в App Store, заставила инвесторов задуматься об эффективности их вложений, а заодно — обвалила акции Nvidia и ещё нескольких технологических гигантов, в том числе Intel. Правда ли, что DeepSeek — серьёзный конкурент ChatGPT, и как пользоваться нейросетью в России (спойлер: очень легко и бесплатно) — в этом тексте.

Содержание:

Что это за нейросеть: история
Развитие событий вокруг DeepSeek R1
Что умеет DeepSeek
Как зарегистрироваться
Как пользоваться DeepSeek (бонус: эксперименты)
Эксперимент: кодинг
Эксперимент: анализ творчества
Эксперимент: генерация картинки
Эксперимент: анализ данных
Почему DeepSeek стоит попробовать

DeepSeek — это стартап, или китайская исследовательская лаборатория искусственного интеллекта, которая выросла из хедж-фондовой компании High-Flyer в 2023 году. Тогда основатель компании Лян Вэньфэн инициировал разработку нового ИИ с открытым кодом, который должен был конкурировать с другими LLM (с англ. large language model — «большая языковая модель»), в частности с GPT-4. Забегая вперёд: у разработчиков это получилось.

Первые упоминания о DeepSeek появились в ноябре 2023 года. Тогда стартап выпустил DeepSeek Coder — модель для написания кода.
В мае 2024 года появилась DeepSeek-V2. Она, как и предшественница, была заточена под написание и проверку кода, но понимала и естественные языки.
В ноябре 2024 года разработчики открыли доступ к большой языковой модели DeepSeek-V3 с 671 млрд параметров. Разработчики уверяли, что близки к созданию разумного ИИ. Такие утверждения они делали благодаря архитектуре Multi-token Prediction (она позволяет анализировать сразу несколько слов вместо одного), архитектуре Mixture of Experts (анализирует данные с помощью нескольких нейросетей-экспертов), технологии Multi-head Latent Attention (вычленяет важные данные).
20 января 2025 года компания представила большие языковые модели DeepSeek-R1-Zero и DeepSeek-R1, основанные на V3. По заявлению разработчиков, модель кодит и решает математические и логические задачи на уровне o1 от OpenAI или даже лучше.

Логотип DeepSeek. Источник: deepseek.com

Предисловие: создание китайской нейросети обошлось всего в $5 млн. Для сравнения: OpenAI потратила $100 млн только на разработку GPT-4. Низкая стоимость и результаты работы DeepSeek заставили инвесторов усомниться, что в развитие ИИ стоит вкладывать миллиарды долларов. Это может стать переломным моментом для индустрии.

Вокруг DeepSeek-R1 спустя несколько дней после запуска поднялась шумиха. Новости об обвале акций и кибератаках появлялись практически каждый час.

DeepSeek обогнала ChatGPT по количеству скачиваний в App Store в Австралии, Канаде, Китае, Сингапуре, США и Великобритании. К 25 января приложение скачали 1,6 млн раз.
27 января акции разработчика графических процессоров Nvidia упали на 16% (из-за этого рыночная капитализация упала на $600 млрд), Broadcom — на 17%, Alphabet — на 4%, AMD — на 6%, Intel — на 2%. Произошло это из-за того, что производительность китайского ИИ оказалась не хуже западных аналогов, чья разработка стоила в разы больше.
Вечером 27 января DeepSeek подверглась кибератаке. Новые пользователи временно не могли зарегистрироваться в сервисе.

На момент публикации статьи (28 января 2025 года) DeepSeek-R1 — новейшая модель, которая:

Ищет ошибки и сама пишет код на языках C++, Go, Java, JavaScript, Python, Rust.
Анализирует большие объёмы данных и помогает с выводами.
«Думает» перед тем, как ответить, генерирует цепочку мыслей. Это делает ответ более точным и позволяет человеку проследить за логикой нейросети.
Решает логические и математические задачи.
Работает с текстом — отвечает на вопросы, поддерживает беседу, переводит.
Генерирует изображения (присылает ссылку на готовую картинку в чат).
Придумывает мемы, а точнее — их описание.

Откройте главную страницу www.deepseek.com и кликните на кнопку «Start now».
Выберите способ регистрации — через почту или Google-аккаунт.
Готово!

У DeepSeek также есть приложение. Скачать его можно в App Store, Google Play или просканировав QR-код на сайте (кнопка «Get DeepSeek App» на главной странице).

Чат-бот и приложение бесплатны, а вот доступ к API DeepSeek платный: от $0,14 за миллион токенов (наименьшая единица текста). Стоимость и скорость ответа зависят от модели и кеширования контента.

Интерфейс DeepSeek. Источник: deepseek.com

Кроме этого, нейросетью можно пользоваться локально — прямо на ПК. Нужно только установить бесплатный фреймворк для запуска и управления большими языковыми моделями (LLM) Ollama:

На стартовой странице инструмента нажмите кнопку «Download».
Выберите версию Ollama — для MacOS, Linux или Windows. Подсказка: подписываться на уведомление об обновлениях не обязательно.
Установите скачанное приложение.
Проверьте, нет ли ошибок при установке. Для этого в терминале введите «ollama -v». Если установка прошла успешно, в терминале появится строка с версией Ollama.
На сайте во вкладке «Models» выберите deepseek-r1.
Подберите модель в зависимости от мощности процессора и оперативной памяти. Например, чтобы установить модель 70b, оперативной памяти должно быть не меньше 40 Гб. Кроме того, нужно иметь высокопроизводительный графический процессор, например Nvidia RTX 3090 (такие процессоры могут стоить сотни тысяч рублей). А вот для модели 7b будет достаточно оперативной памяти от 3,5 Гб и графического процессора от 12 Гб и выше.
Скачайте и запустите выбранную модель в терминале. Введите «ollama run deepseek-r1:7b», если выбрали модель 7b.
Готово. Можете пользоваться нейросетью.

Лайфхак: рассчитать минимальные требования для работы с определённой LLM-моделью можно в этом калькуляторе.

Терминал с проверкой установки. Источник: личный архив редактора

Зачем скачивать DeepSeek на компьютер?

Получить максимум конфиденциальности.
Работать с нейросетью без подключения к интернету.
Обойти вероятные ограничения или подписку.

Бонус для разработчиков: благодаря открытому коду DeepSeek можно обернуть в собственный интерфейс или доработать.

В веб-версии рабочая область нейросети напоминает ChatGPT. В окне чат-бота нужно написать промпт — задание, которое должна выполнить нейросеть.

Кнопка «DeepThinking (R1)» подключает функцию глубокого анализа. Когда она включена, DeepSeek использует расширенные алгоритмы и генерирует развёрнутые ответы. В чате это выглядит как мыслительный процесс, которым нейросеть делится с человеком.

«Мыслительный процесс», при котором DeepSeek пытается понять, какое время на часах с загруженной картинки. Результат: у нейросети не получилось определить время. Источник: DeepSeek

Кнопка «Search» подключает нейросеть к интернету. Если эта функция включена, DeepSeek анализирует данные в реальном времени по открытым источникам.
Кнопка со скрепкой нужна для загрузки файлов в чат-бот. Она пригодится, чтобы скинуть нейросети данные для анализа.

Начнём новый чат. В нём попро��им DeepSeek написать программу движения робота, останавливающегося при достижении чёрной линии. Нейросеть сгенерировала код на языке Python, добавила комментарии, объяснила свою логику и привела пример для использования кода на платформе LEGO Mindstorms EV3 (на MicroPython).

В новом чате спросим у нейросети, как она понимает смысл пушкинских строк. Результат: нейросеть составила текст, который можно использовать в школьном реферате. Она объяснила общий смысл, указала источник строк и сделала подробный анализ смысла произведения.

В чат-боте попросим сгенерировать картинку по промпту: «Драконы празднуют день рождения в офисе». Если включить функцию DeepThinking (R1), нейросеть дополнит промпт деталями, пропишет цветовую гамму и настроение. Интересно, что в «мыслительном процессе» DeepSeek сообщает, что генерировать картинку будет в DALL-e, но на деле присылает ссылку на изображение, созданное в нейросети pollinations.ai.

И это не единственная ошибка самоидентификации у DeepSeek. В «общении» нейросеть называет себя ChatGPT. Эксперт по машинному обучению Аакаш Кумар Найн считает, что происходит это из-за того, что «многие данные, доступные в интернете, уже были загрязнены GPT».

Результат генерации картинки. Источник: DeepSeek

С помощью кнопки-скрепки загрузим в чат скриншот с характеристиками кофемашины и попросим нейросеть определить, какое давление у помпы. Результат: DeepSeek дала правильный ответ, но кроме этого поделилась рекомендацией — какое давление будет оптимальным для приготовления эспрессо.

Результат анализа характеристик кофемашины. Источник: DeepSeek

Это бесплатная нейросеть — конкурент чат-бота ChatGPT, подписка на который стоит $200.
DeepSeek отлично работает в России, в нём легко зарегистрироваться, а при использовании нет никаких ограничений.
Ради интереса — разработка нейросети обошлась всего в $5 млн.

А как вы думаете, DeepSeek правда может изменить рынок нейросетей? Будут ли инвесторы отдавать предпочтение небольшим компаниям-разработчикам вместо зарекомендовавших себя, но дорогих гигантов?

Нейросеть DeepSeek: что умеет и как конкурирует с ChatGPT

Что это за нейросеть: история

Развитие событий вокруг DeepSeek R1

Что умеет DeepSeek

Как зарегистрироваться

Как пользоваться DeepSeek (бонус: эксперименты)

Эксперимент: кодинг

Эксперимент: анализ творчества

Эксперимент: генерация картинки

Эксперимент: анализ данных

Почему DeepSeek стоит попробовать