DeepSeek: как китайский "убийца ChatGPT" меняет правила игры в AI? 🤔
Если ваши позиции в крипте еще не ликвидировало и вы готовы воспринимать какую-то информацию, тогда это для вас
Недавно китайцы запустили "убийцу ChatGPT" – DeepSeek. Казалось бы, что ничего необычного в этом нет – еще одна нейросеть… но это только на первый взгляд
На деле же, DeepSeek – это не просто еще одна нейросеть, а, скорее, новая веха развития в мире искусственного интеллекта
_____
Так в чем дело?
Сейчас обучение топовых AI-моделей стоит космических денег. OpenAI, Anthropic и другие тратят $100M+ только на вычислительные мощности
Помимо этого, им нужны огромные дата-центры с тысячами GPU стоимостью $40K+ каждый (это как строить целую электростанцию, чтобы запустить один завод)
А теперь представьте. DeepSeek приходит и говорит:
"А давайте сделаем это за $5M?"
И они не просто говорят – они реально это делают. Их модели уже конкурируют с GPT-4 и Claude по многим задачам
_____
Как им это удалось?
1. Оптимизация вычислений
Традиционные модели используют 32-битные числа для расчетов
DeepSeek перешел на 8-битные, что сократило потребление памяти на 75%
2. Мультитокенность ("multi-token" system)
Обычные AI читают текст как первоклассники: "Кот... сидит... на... ковре..."
DeepSeek обрабатывает целые фразы сразу, что делает его в 2 раза быстрее при сохранении 90% точности
3. Экспертная система
Вместо одной огромной модели, которая пытается знать всё (как юрист, врач, инженер в одном лице), DeepSeek использует "узких экспертов", которые активируются только тогда, когда это нужно
Например:
- Традиционные модели: 1.8 триллиона параметров активны постоянно
- DeepSeek: 671 миллиардов параметров, но только 37 миллиардов активны одновременно
Условно говоря, когда вы делаете юридический запрос, то вам отвечает "AI-юрист", который "имеет экспертизу в этой области", а не "AI-инженер", который ничего в этом не понимает. Это позволяет сделать ответ более точным и специализированным
_____
Что это дает? 🚀
- Стоимость обучения: $100M → $5M
- Количество GPU: 100,000 → 2,000
- API-запросы: на 95% дешевле
- Аппаратное обеспечение: вместо дата-центров – обычные игровые видеокарты
Более подробно можете почитать здесь:
https://x.com/morganb/status/1883686162709295541?s=46
_____
Почему это влияет на рынок?
1. AI становится доступнее
Теперь для разработки AI не нужны миллиардные бюджеты
Несколько мощных GPU – и вы в игре
2. Конкуренция растет
Гибкие стартапы вроде DeepSeek бросают вызов гигантам вроде OpenAI и Anthropic
3. Стоимость оборудования падает
NVIDIA, которая зарабатывает на сверхдорогих GPU, теперь в зоне риска
А поскольку NVIDIA занимает первое место в мире по рыночной капитализации ($3.4 трлн), то новости о зарождении конкурентов, которые могут приостановить количество поставок GPU, понятное дело, вызовет определенные колебания на рынке
В свою очередь, крипторынок, который на данный момент до сих пор зависит от фондового, идет вслед за ним (но только семимильными шагами) 😁
Также у меня есть TG-канал, в котором все посты появляются намного раньше и чаще – жду каждого!
Deep Seek действительно неплох, но если посмотреть, то достаточно много китайских убийц Chat GPT уже было на рынке, но почему то этот же самый Chat чувствует себя очень даже уверенно
Да, так оно и есть. Лично мне все равно удобнее и привычнее Chat GPT