Нейросеть DeepSeek: что умеет и как конкурирует с ChatGPT

Китайские модели кодят, «говорят» на русском и зарождают сомнения в эффективности крупных вложений в ИИ.

Нейросеть DeepSeek: что умеет и как конкурирует с ChatGPT

В январе 2025 года китайская нейросеть DeepSeek сдвинула чат-бот компании OpenAI с пьедестала: обогнала ChatGPT по количеству скачиваний в App Store, заставила инвесторов задуматься об эффективности их вложений, а заодно — обвалила акции Nvidia и ещё нескольких технологических гигантов, в том числе Intel. Правда ли, что DeepSeek — серьёзный конкурент ChatGPT, и как пользоваться нейросетью в России (спойлер: очень легко и бесплатно) — в этом тексте.

Содержание:

Что это за нейросеть: история

DeepSeek — это стартап, или китайская исследовательская лаборатория искусственного интеллекта, которая выросла из хедж-фондовой компании High-Flyer в 2023 году. Тогда основатель компании Лян Вэньфэн инициировал разработку нового ИИ с открытым кодом, который должен был конкурировать с другими LLM (с англ. large language model — «большая языковая модель»), в частности с GPT-4. Забегая вперёд: у разработчиков это получилось.

  • Первые упоминания о DeepSeek появились в ноябре 2023 года. Тогда стартап выпустил DeepSeek Coder — модель для написания кода.
  • В мае 2024 года появилась DeepSeek-V2. Она, как и предшественница, была заточена под написание и проверку кода, но понимала и естественные языки.
  • В ноябре 2024 года разработчики открыли доступ к большой языковой модели DeepSeek-V3 с 671 млрд параметров. Разработчики уверяли, что близки к созданию разумного ИИ. Такие утверждения они делали благодаря архитектуре Multi-token Prediction (она позволяет анализировать сразу несколько слов вместо одного), архитектуре Mixture of Experts (анализирует данные с помощью нескольких нейросетей-экспертов), технологии Multi-head Latent Attention (вычленяет важные данные).
  • 20 января 2025 года компания представила большие языковые модели DeepSeek-R1-Zero и DeepSeek-R1, основанные на V3. По заявлению разработчиков, модель кодит и решает математические и логические задачи на уровне o1 от OpenAI или даже лучше.
Логотип DeepSeek. Источник: deepseek.com
Логотип DeepSeek. Источник: deepseek.com

Развитие событий вокруг DeepSeek R1

Предисловие: создание китайской нейросети обошлось всего в $5 млн. Для сравнения: OpenAI потратила $100 млн только на разработку GPT-4. Низкая стоимость и результаты работы DeepSeek заставили инвесторов усомниться, что в развитие ИИ стоит вкладывать миллиарды долларов. Это может стать переломным моментом для индустрии.

Вокруг DeepSeek-R1 спустя несколько дней после запуска поднялась шумиха. Новости об обвале акций и кибератаках появлялись практически каждый час.

  • DeepSeek обогнала ChatGPT по количеству скачиваний в App Store в Австралии, Канаде, Китае, Сингапуре, США и Великобритании. К 25 января приложение скачали 1,6 млн раз.
  • 27 января акции разработчика графических процессоров Nvidia упали на 16% (из-за этого рыночная капитализация упала на $600 млрд), Broadcom — на 17%, Alphabet — на 4%, AMD — на 6%, Intel — на 2%. Произошло это из-за того, что производительность китайского ИИ оказалась не хуже западных аналогов, чья разработка стоила в разы больше.
  • Вечером 27 января DeepSeek подверглась кибератаке. Новые пользователи временно не могли зарегистрироваться в сервисе.

Что умеет DeepSeek

На момент публикации статьи (28 января 2025 года) DeepSeek-R1 — новейшая модель, которая:

  • Ищет ошибки и сама пишет код на языках C++, Go, Java, JavaScript, Python, Rust.
  • Анализирует большие объёмы данных и помогает с выводами.
  • «Думает» перед тем, как ответить, генерирует цепочку мыслей. Это делает ответ более точным и позволяет человеку проследить за логикой нейросети.
  • Решает логические и математические задачи.
  • Работает с текстом — отвечает на вопросы, поддерживает беседу, переводит.
  • Генерирует изображения (присылает ссылку на готовую картинку в чат).
  • Придумывает мемы, а точнее — их описание.

Как зарегистрироваться

  1. Откройте главную страницу www.deepseek.com и кликните на кнопку «Start now».
  2. Выберите способ регистрации — через почту или Google-аккаунт.
  3. Готово!

У DeepSeek также есть приложение. Скачать его можно в App Store, Google Play или просканировав QR-код на сайте (кнопка «Get DeepSeek App» на главной странице).

Чат-бот и приложение бесплатны, а вот доступ к API DeepSeek платный: от $0,14 за миллион токенов (наименьшая единица текста). Стоимость и скорость ответа зависят от модели и кеширования контента.

Интерфейс DeepSeek. Источник: deepseek.com
Интерфейс DeepSeek. Источник: deepseek.com

Кроме этого, нейросетью можно пользоваться локально — прямо на ПК. Нужно только установить бесплатный фреймворк для запуска и управления большими языковыми моделями (LLM) Ollama:

  • На стартовой странице инструмента нажмите кнопку «Download».
  • Выберите версию Ollama — для MacOS, Linux или Windows. Подсказка: подписываться на уведомление об обновлениях не обязательно.
  • Установите скачанное приложение.
  • Проверьте, нет ли ошибок при установке. Для этого в терминале введите «ollama -v». Если установка прошла успешно, в терминале появится строка с версией Ollama.
  • На сайте во вкладке «Models» выберите deepseek-r1.
  • Подберите модель в зависимости от мощности процессора и оперативной памяти. Например, чтобы установить модель 70b, оперативной памяти должно быть не меньше 40 Гб. Кроме того, нужно иметь высокопроизводительный графический процессор, например Nvidia RTX 3090 (такие процессоры могут стоить сотни тысяч рублей). А вот для модели 7b будет достаточно оперативной памяти от 3,5 Гб и графического процессора от 12 Гб и выше.
  • Скачайте и запустите выбранную модель в терминале. Введите «ollama run deepseek-r1:7b», если выбрали модель 7b.
  • Готово. Можете пользоваться нейросетью.

Лайфхак: рассчитать минимальные требования для работы с определённой LLM-моделью можно в этом калькуляторе.

Зачем скачивать DeepSeek на компьютер?

  • Получить максимум конфиденциальности.
  • Работать с нейросетью без подключения к интернету.
  • Обойти вероятные ограничения или подписку.

Бонус для разработчиков: благодаря открытому коду DeepSeek можно обернуть в собственный интерфейс или доработать.

Как пользоваться DeepSeek (бонус: эксперименты)

В веб-версии рабочая область нейросети напоминает ChatGPT. В окне чат-бота нужно написать промпт — задание, которое должна выполнить нейросеть.

  • Кнопка «DeepThinking (R1)» подключает функцию глубокого анализа. Когда она включена, DeepSeek использует расширенные алгоритмы и генерирует развёрнутые ответы. В чате это выглядит как мыслительный процесс, которым нейросеть делится с человеком.
«Мыслительный процесс», при котором DeepSeek пытается понять, какое время на часах с загруженной картинки. Результат: у нейросети не получилось определить время. Источник: DeepSeek
«Мыслительный процесс», при котором DeepSeek пытается понять, какое время на часах с загруженной картинки. Результат: у нейросети не получилось определить время. Источник: DeepSeek
  • Кнопка «Search» подключает нейросеть к интернету. Если эта функция включена, DeepSeek анализирует данные в реальном времени по открытым источникам.

  • Кнопка со скрепкой нужна для загрузки файлов в чат-бот. Она пригодится, чтобы скинуть нейросети данные для анализа.

Эксперимент: кодинг

Начнём новый чат. В нём попросим DeepSeek написать программу движения робота, останавливающегося при достижении чёрной линии. Нейросеть сгенерировала код на языке Python, добавила комментарии, объяснила свою логику и привела пример для использования кода на платформе LEGO Mindstorms EV3 (на MicroPython).

Источник: DeepSeek
Источник: DeepSeek

Эксперимент: анализ творчества

В новом чате спросим у нейросети, как она понимает смысл пушкинских строк. Результат: нейросеть составила текст, который можно использовать в школьном реферате. Она объяснила общий смысл, указала источник строк и сделала подробный анализ смысла произведения.

Источник: DeepSeek
Источник: DeepSeek

Эксперимент: генерация картинки

В чат-боте попросим сгенерировать картинку по промпту: «Драконы празднуют день рождения в офисе». Если включить функцию DeepThinking (R1), нейросеть дополнит промпт деталями, пропишет цветовую гамму и настроение. Интересно, что в «мыслительном процессе» DeepSeek сообщает, что генерировать картинку будет в DALL-e, но на деле присылает ссылку на изображение, созданное в нейросети pollinations.ai.

И это не единственная ошибка самоидентификации у DeepSeek. В «общении» нейросеть называет себя ChatGPT. Эксперт по машинному обучению Аакаш Кумар Найн считает, что происходит это из-за того, что «многие данные, доступные в интернете, уже были загрязнены GPT».

Результат генерации картинки. Источник: DeepSeek
Результат генерации картинки. Источник: DeepSeek

Эксперимент: анализ данных

С помощью кнопки-скрепки загрузим в чат скриншот с характеристиками кофемашины и попросим нейросеть определить, какое давление у помпы. Результат: DeepSeek дала правильный ответ, но кроме этого поделилась рекомендацией — какое давление будет оптимальным для приготовления эспрессо.

Результат анализа характеристик кофемашины. Источник: DeepSeek
Результат анализа характеристик кофемашины. Источник: DeepSeek

Почему DeepSeek стоит попробовать

  • Это бесплатная нейросеть — конкурент чат-бота ChatGPT, подписка на который стоит $200.
  • DeepSeek отлично работает в России, в нём легко зарегистрироваться, а при использовании нет никаких ограничений.
  • Ради интереса — разработка нейросети обошлась всего в $5 млн.

А как вы думаете, DeepSeek правда может изменить рынок нейросетей? Будут ли инвесторы отдавать предпочтение небольшим компаниям-разработчикам вместо зарекомендовавших себя, но дорогих гигантов?

21
8
2
13 комментариев

К сожалению в статье много передергиваний и некорректных сравнений. Так, "обогнала по количеству скачиваний" только в мобильном приложении и только за январь, при этом мобильное приложение ЧатГПТ, в месяц выхода было загружено более 3,8 млн раз (https://www.statista.com/statistics/1386342/chat-gpt-app-downloads/), что более чем вдвое превышает результаты DeepSeek на старте.
Утверждение, что выход DeepSeek привел к падению акций NVIDIA и видимо всего NASDAQ основывается на кликбейтном заголовке никому не известной индийской газеты, более серьезные издания используют формулировку "падение произошло на фоне сообщений о DeepSeek", при этом если посмотреть на график акций NVIDIA, то это изменение походит на вполне ожидаемую корректировку при постоянном и слабо обоснованном росте в преддверии официальной отчетности ну и уже отыгрываться назад начало. вообще, гадать о причинах постоянно происходящих падений/росте акций несколько неблагодарное занятие.
Также ничего не сказано про то, что данная модель является творческой переработкой самого ЧатГПТ, а не полностью оригинальной разработкой (куски от ЧатГПТ постоянно встречаются в ответах), т.е. китайцы опять продемонстрировали свою способность копировать чужой опыт/продукт и воспроизводить его заметно дешевле, что конечно для нас, как потенциальных потребителей неплохо.

3

в разы большеВсё же корректно говорить "в несколько раз больше/меньше" или "на порядок/порядки". Ну это я так, форточку прикрыл (-:
Вообще, молодцы товарищи китайцы!

1

У программистов порядок это в 2 раза, во всяком случае у олдов. Так что путаница возникает такая же с в/на.

А мне понравился DeepSeek R1!
Ради интереса накодил в нём за 2 часа сервис проверки текста на нейросетевые штампы и повторы слов (примитивное сравнение с шаблоном и подсчёт): он сам придумал алгоритм, код, фронтенд и тд., очень прикольно, а главное без ограничений на количество запросов как в О1
Потестить можно тут: https://textme.work/parasites/

Ещё погенерил стандартные тексты типа "как заработать миллион на закупах в телеграм-канале и сделать стратегию контент-маркетинга" с целью понять штампы и клише DeepSeek. Очень много совпадает с ChatGPT 4o, но есть и много своих плюшек, выдающих нейросеть. В общем, кайф!

1

Автор сначала рассказывает, куда нажать, чтобы включить R1, а потом показывает нам примеры использования "анализа" с выключенным режимом R1, то есть используя другую модель - совсем не ту, которая навела шуму

Не говорю уже о других ошибках, например что deepseek-r1 7b в ollama это не r1 и даже не совсем deepseek

1

скачала приложение и оно говорит, что не рисует. где вы нашли картинки, что я делаю не так

1