Как китайцы из DeepSeek взорвали рынок ИИ, потратив в 20 раз меньше денег чем OpenAI
Привет, друзья, Климент на связи!
Последние несколько дней я внимательно следил за историей, которая может полностью изменить расстановку сил в мире ИИ. И нет, это не очередной анонс от OpenAI или Anthropic.
Китайский стартап DeepSeek сделал то, что многие считали невозможным – создал языковую модель уровня OpenAI o1 и Claude 3.5 Sonnet, потратив всего $5,6 млн. При этом, модель сразу попала на один уровень с американскими конкурентами, показывая топовые результаты в бенчмарках на размышление и другие задачи. Для сравнения: OpenAI вложили в разработку ChatGPT-4 $100+ млн, а стоимость более поздних моделей явно не уменьшилась.
Звучит безумно? Давайте разберемся, как китайцам это удалось.
В чём фишка?
Главный секрет DeepSeek – инновационный подход к архитектуре ИИ. Вместо того чтобы идти проторенной дорожкой и наращивать мощности, команда сделала ставку на три ключевые инновации:
- Оптимизация памяти: снизили точность вычислений, сэкономив 75% ресурсов без потери качества;
- Multi-token Prediction: научили модель читать текст целыми фразами, а не пословно;
- Мультиэкспертный подход: вместо одной огромной модели создали систему специализированных "экспертов".
На практике последний пункт означает, что при обработке запроса активируются только нужные "эксперты" – как если бы в компании над задачей работали только профильные специалисты, а не весь штат разом. На один запрос расходуется примерно 37 млрд из 671 млрд параметров, что обеспечивает экономию памяти и ресурсов, о чем я говорил выше. Гениально и просто!
Что это значит для рынка?
Эффект разорвавшейся бомбы — это даже мягко сказано. Акции NVIDIA рухнули на 12% после новостей о DeepSeek. Еще бы: если для работы достаточно 2048 GPU вместо 100 000 у ChatGPT, кому нужны супердорогие серверные решения?
Но главное – это подрыв монополии техгигантов. DeepSeek доказал: можно создавать конкурентоспособные ИИ-модели без бюджетов уровня OpenAI. Более того, их модель имеет открытый исходный код и ее можно натренировать на обычных видеокартах. Я не шучу, представители DeepSeek сами написали об этом в X:
Мой взгляд на ситуацию
Как человек, который много лет следит за развитием ИИ, могу сказать: мы наблюдаем исторический момент. Это сравнимо с появлением персональных компьютеров — технология, которая была доступна только гигантам, становится достоянием масс.
Что дальше?
Думаю, в ближайший год-два мы увидим взрывной рост небольших ИИ-стартапов, которые возьмут на вооружение подход DeepSeek. Эра монополии техгигантов в ИИ подходит к концу – и это прекрасные новости для всей индустрии.
А что думаете вы? Как оцениваете перспективы китайского подхода к разработке ИИ? Делитесь мнением в комментариях!