DeepSeek, который обвалил капитализацию крупных компаний: почему это угроза для Nvidia и что здесь вообще происходит

На днях Морган Браун, вице-президент по развитию продуктов (Instagram (в РФ запрещен), Dropbox, Shopify), поделился интересным наблюдением: DeepSeek в корне меняет представление о стоимости и доступности ИИ. И если ранее мы (да и я лично) писали про DeepSeek-V3, как о доступном и достойном чате - конкуренте нашумевшему ChatGPT, то теперь выясняется, что DeepSeek реально готов пошатнуть рынок многомиллиардных (или даже триллионных) инфраструктурных затрат. И тут Nvidia, известная своими дорогими GPU, может «заплакать». Разберемся, что к чему.

@HumanRadyTech
@HumanRadyTech

В чём суть открытия DeepSeek?

  • Обучение ИИ раньше — ужасно дорого Гиганты типа OpenAI или Anthropic тратят по $100 млн на вычислительные ресурсы, используя тысячи GPU по $40k каждая. Представьте: вам нужно запустить завод, но параллельно ещё и содержать собственную электростанцию.
  • DeepSeek говорит «а давайте сделаем это за $5 млн» И что удивительно — они уже сделали. Их модели бьют или как минимум сравнимы с GPT-4 и Claude по многим задачам. Это рушит представление «большой компании с миллиардом долларов» как единственного пути к крутым ИИ.
  • Умная оптимизация: 8 знаков после запятой вместо 32 Базовая идея: зачем хранить такой избыточный объём данных, если можно уменьшить точность и при этом не потерять в качестве ответов. Экономия памяти — –75%. То есть огромная доля затрат на «железо» отпадает.
  • «Мульти-токеновая» система DeepSeek обрабатывает фразы пачками, а не по одному слову, что ускоряет работу и сохраняет точность. При гигантском количестве обрабатываемых данных это колоссальная выгода во времени и ресурсах.
  • Экспертная система вместо монолитного «знаю всё» Традиционные модели держат в активном состоянии все свои триллионы параметров.У DeepSeek — множество «мини-моделей-экспертов», где включаются только нужные экспертные блоки под конкретную задачу. В итоге 671 млрд параметров, но реально задействованы только 37 млрд. Это огромная экономия вычислений и энергозатрат.
  • Низкая стоимость обучения и обслуживания $100 млн -> $5 млн и 100k GPU -> 2k GPU: разница грандиозная.DeepSeek могут работать даже на игровых GPU, что, по сути, делает ИИ-операции более доступными (и где Nvidia лишается возможности втюхивать вам серверные «монстры» по бешеным ценам).
  • Код открыт Нет секрета «волшебства». Весь софт выложен, и любой может проверить, улучшить, внедрить. Участие сообщества только ускорит совершенствование системы.
  • Почему Nvidia может быть в шоке? Сейчас огромная маржа на профессиональные графические чипы. Но если всё можно запускать на игровых GPU — зачем платить больше?Бизнес-модель «продавай топовые GPU за $40k» начинает трещать.
  • Эффект «дизраптора» Крупные игроки оптимизируют прежний подход: «бери больше GPU, трать больше денег, строй дата-центры». DeepSeek с их идеей «делать умнее, а не сильнее» могут всё переменить, сделав дорогое (и сложное) обучение ИИ дешевым и простым.
  • Что дальше?
  • OpenAI, Anthropic, Meta (запрещена в РФ) и т.д. не будут сидеть сложа руки — они, вероятно, тоже внедрят новые методы. Но назад откат уже вряд ли возможен.
  • ИИ станет доступнее, появится больше разработчиков, конкуренция взлетит. Nvidia придётся придумать новые аргументы для своих дорогих решений.

DeepSeek-V3: припомним старое (теперь ещё более актуальное)

Я уже писал о DeepSeek-V3 — их тогдашняя «дёшевая» (а местами бесплатная) модель дала понять, что этот сервис может заменить многие платные решения. Преимущества были очевидны:

  • Лучшая точность поиска, чем у ChatGPT
  • Поддержка более качественных клиентов (по моему опыту) PDF-анализов, не доступная в бесплатном ChatGPT
  • Более глубокие и точные рассуждения — превосходили GPT-4o в ряде тестов
  • Открытый исходный код (занаю, что наши топ компании активно это используют) 🤨
  • Полностью бесплатная база (плюс недорогие апгрейды)
  • Мультимодальность (текст, изображения, видео…)

И теперь, с учётом новых фактов от Моргана Брауна, становится ясно, что DeepSeek не просто «дёшево и сердито», а действительно прорывная технология, решившая фундаментальный вопрос: как сильно удешевить обучение больших моделей.

Итоги и выводы

  • DeepSeek — тот самый «дизраптор», который оптимизировал подход, снижая гигантские траты на GPU и энергию.
  • Nvidia возможно, придётся менять стратегию, потому что рынок уже понял: монолитный подход к ИИ — это дорого и неэффективно.
  • Открытый код и мини-эксперты вместо «одной гигантской модели» выглядят как новая парадигма в разработке ИИ.
  • Дешёвый и быстрый ИИ станет реальностью для всех, а не привилегией больших корпораций с миллиардными бюджетами.

А еще я спросил у DeepSeek "Правда, что ты потребляешь меньше энергии?" (предварительно скормив ему эту статью)

Ответ DeepSeek удивил

Теперь вопрос лишь в том, насколько быстро это всё распространится и кто успеет адаптироваться. Это один из тех моментов, когда инновация в корне меняет «правила игры», и остаётся только наблюдать, кто станет новым лидером, а кто — «пострадавшим гигантом».

Автор: Виталий, который смотрит на цифры DeepSeek и понимает: будущее уже здесь.

*Не забудьте подписаться на наш канал «Человеку приготовиться» и следить за новыми обновлениями о самых крутых AI-сервисах!

1
Начать дискуссию