DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔

Если ваши позиции в крипте еще не ликвидировало и вы готовы воспринимать какую-то информацию, тогда это для вас

Недавно китайцы запустили "убийцу ChatGPT" – DeepSeek. Казалось бы, что ничего необычного в этом нет – еще одна нейросеть… но это только на первый взгляд

DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔

На деле же, DeepSeek – это не просто еще одна нейросеть, а, скорее, новая веха развития в мире искусственного интеллекта

_____

Сейчас обучение топовых AI-моделей стоит космических денег. OpenAI, Anthropic и другие тратят $100M+ только на вычислительные мощности

Помимо этого, им нужны огромные дата-центры с тысячами GPU стоимостью $40K+ каждый (это как строить целую электростанцию, чтобы запустить один завод)

А теперь представьте. DeepSeek приходит и говорит:

"А давайте сделаем это за $5M?"

И они не просто говорят – они реально это делают. Их модели уже конкурируют с GPT-4 и Claude по многим задачам

_____

Традиционные модели используют 32-битные числа для расчетов

DeepSeek перешел на 8-битные, что сократило потребление памяти на 75%

Обычные AI читают текст как первоклассники: "Кот... сидит... на... ковре..."

DeepSeek обрабатывает целые фразы сразу, что делает его в 2 раза быстрее при сохранении 90% точности

Вместо одной огромной модели, которая пытается знать всё (как юрист, врач, инженер в одном лице), DeepSeek использует "узких экспертов", которые активируются только тогда, когда это нужно

Например:

- Традиционные модели: 1.8 триллиона параметров активны постоянно

- DeepSeek: 671 миллиардов параметров, но только 37 миллиардов активны одновременно

Условно говоря, когда вы делаете юридический запрос, то вам отвечает "AI-юрист", который "имеет экспертизу в этой области", а не "AI-инженер", который ничего в этом не понимает. Это позволяет сделать ответ более точным и специализированным

_____

- Стоимость обучения: $100M → $5M

- Количество GPU: 100,000 → 2,000

- API-запросы: на 95% дешевле

- Аппаратное обеспечение: вместо дата-центров – обычные игровые видеокарты

https://x.com/morganb/status/1883686162709295541?s=46

_____

1. AI становится доступнее

Теперь для разработки AI не нужны миллиардные бюджеты

Несколько мощных GPU – и вы в игре

2. Конкуренция растет

Гибкие стартапы вроде DeepSeek бросают вызов гигантам вроде OpenAI и Anthropic

3. Стоимость оборудования падает

NVIDIA, которая зарабатывает на сверхдорогих GPU, теперь в зоне риска

А поскольку NVIDIA занимает первое место в мире по рыночной капитализации ($3.4 трлн), то новости о зарождении конкурентов, которые могут приостановить количество поставок GPU, понятное дело, вызовет определенные колебания на рынке

В свою очередь, крипторынок, который на данный момент до сих пор зависит от фондового, идет вслед за ним (но только семимильными шагами) 😁

Также у меня есть TG-канал, в котором все посты появляются намного раньше и чаще – жду каждого!

3 комментария

Deep Seek действительно неплох, но если посмотреть, то достаточно много китайских убийц Chat GPT уже было на рынке, но почему то этот же самый Chat чувствует себя очень даже уверенно

Дмитрий Панасюк

Автор

Да, так оно и есть. Лично мне все равно удобнее и привычнее Chat GPT

DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔

Так в чем дело?

Как им это удалось?

1. Оптимизация вычислений

2. Мультитокенность ("multi-token" system)

3. Экспертная система

Что это дает? 🚀

Более подробно можете почитать здесь:

Почему это влияет на рынок?