Как китайцы из DeepSeek взорвали рынок ИИ, потратив в 20 раз меньше денег чем OpenAI

Привет, друзья, Климент на связи!

Последние несколько дней я внимательно следил за историей, которая может полностью изменить расстановку сил в мире ИИ. И нет, это не очередной анонс от OpenAI или Anthropic.

Китайский стартап DeepSeek сделал то, что многие считали невозможным – создал языковую модель уровня OpenAI o1 и Claude 3.5 Sonnet, потратив всего $5,6 млн. При этом, модель сразу попала на один уровень с американскими конкурентами, показывая топовые результаты в бенчмарках на размышление и другие задачи. Для сравнения: OpenAI вложили в разработку ChatGPT-4 $100+ млн, а стоимость более поздних моделей явно не уменьшилась.

Звучит безумно? Давайте разберемся, как китайцам это удалось.

В чём фишка?

Главный секрет DeepSeek – инновационный подход к архитектуре ИИ. Вместо того чтобы идти проторенной дорожкой и наращивать мощности, команда сделала ставку на три ключевые инновации:

  • Оптимизация памяти: снизили точность вычислений, сэкономив 75% ресурсов без потери качества;
  • Multi-token Prediction: научили модель читать текст целыми фразами, а не пословно;
  • Мультиэкспертный подход: вместо одной огромной модели создали систему специализированных "экспертов".

На практике последний пункт означает, что при обработке запроса активируются только нужные "эксперты" – как если бы в компании над задачей работали только профильные специалисты, а не весь штат разом. На один запрос расходуется примерно 37 млрд из 671 млрд параметров, что обеспечивает экономию памяти и ресурсов, о чем я говорил выше. Гениально и просто!

Что это значит для рынка?

Эффект разорвавшейся бомбы — это даже мягко сказано. Акции NVIDIA рухнули на 12% после новостей о DeepSeek. Еще бы: если для работы достаточно 2048 GPU вместо 100 000 у ChatGPT, кому нужны супердорогие серверные решения?

Но главное – это подрыв монополии техгигантов. DeepSeek доказал: можно создавать конкурентоспособные ИИ-модели без бюджетов уровня OpenAI. Более того, их модель имеет открытый исходный код и ее можно натренировать на обычных видеокартах. Я не шучу, представители DeepSeek сами написали об этом в X:

Как китайцы из DeepSeek взорвали рынок ИИ, потратив в 20 раз меньше денег чем OpenAI

Мой взгляд на ситуацию

Как человек, который много лет следит за развитием ИИ, могу сказать: мы наблюдаем исторический момент. Это сравнимо с появлением персональных компьютеров — технология, которая была доступна только гигантам, становится достоянием масс.

Да, скептики говорят о возможной господдержке Китая и заниженных цифрах. Но факт остается фактом: DeepSeek работает, и работает хорошо. Мы уже добавили их модель в GPTunneL.

Что дальше?

Думаю, в ближайший год-два мы увидим взрывной рост небольших ИИ-стартапов, которые возьмут на вооружение подход DeepSeek. Эра монополии техгигантов в ИИ подходит к концу – и это прекрасные новости для всей индустрии.

А что думаете вы? Как оцениваете перспективы китайского подхода к разработке ИИ? Делитесь мнением в комментариях!

11
18 комментариев