Дик пик… DeepSeek: как переродился «Синий кит», но в виде нейросети. Блог Красовского - полный разбор.

Друзья, вы точно уже читали новости о новой нейросетке Deep Seek, которая громко заявила о себе. С каждым днём гонка двух мастифов накаляется в геометрической прогрессии. Следствием такой популярности стало сарафанное радио и главный вопрос общественности: почему бесплатно?

Небольшое предисловие. В моей компании «Компьютерные Технологии» мы давно активно используем нейросети в работе. Держим руку на пульсе и тестируем новые AI-инструменты сразу после их выхода.

Для генерации изображений наш маркетинговый отдел использует Adobe Firefly и Midjourney. Для более сложных аналитических задач — Chat GPT: он помогает анализировать таблицы, выстраивать тренды, накидывать идеи, позволяет выгружать в него файлы и создавать их. Настоящая палочка-выручалочка, которая сокращает затраты времени в разы и автоматизирует часть процессов. Конечно, у Chat GPT есть свои ограничения из серии краткосрочность памяти, периодически нужно выгружать файлы заново или запрашивать перепроверить свой ответ. Безусловно к ним нужно приноровиться, но польза от них очевидна.

Дик пик… DeepSeek: как переродился «Синий кит», но в виде нейросети. Блог Красовского - полный разбор.

И вот на горизонте новая крупная AI-система. Китайцы выкатили DeepSeek, который претендует на звание азиатского ответа Open AI. Бесплатно, мощно, но с нюансами.

Разбираем, что внутри и что привело к его фурору.

В конце января нейросеть стали активно обсуждать: сначала специалисты Кремниевой долины, потом СМИ, потом обычные пользователи. В итоге 27 января приложение DeepSeek заняло первое место в топе бесплатных приложений App Store в США, а 28 января — в России. По данным сервиса Sensor Tower, 80% загрузок пришлось на период с 20 января.

Разработчики достигли этого благодаря эффективной модели обучения, которая оказалась значительно дешевле подходов конкурентов. В отличие от других нейросетей, DeepSeek построена на архитектуре "mixture of experts", позволяющей обрабатывать данные раздельно, применяя соответствующую экспертность в нужной области. Это позволило обучить модель всего за пару месяцев на относительно скромном кластере из видеокарт NVIDIA H800, затратив около $5,6 миллионов — в 20 раз меньше, чем у конкурентов.

Чем он удивил:

Разбирается в сложных запросах и даёт довольно логичные ответы.

Может работать с текстом, кодом и даже анализировать данные.

Но есть и смешные моменты как «тревожные» размышления нейросетки над ответом. Так же он активно избегает темы китайской политики) Я бы сказал, что Deep Seek на данный момент хорош для решения креативных задач, связанных с кодом и вычислениями, если лень включать VPN или нет возможности пользоваться платным GPT.

Дик пик… DeepSeek: как переродился «Синий кит», но в виде нейросети. Блог Красовского - полный разбор.

Из полезного - открытый исходный код, конструктор для разработчиков. Берёшь основу, допиливаешь под свои задачи и получаешь нейросеть, которая работает именно так, как нужно. DeepSeek можно обучить на своих данных, встроить в готовые проекты и адаптировать под конкретные бизнес-процессы – удобно.

Однако понадобится достаточно мощная техника для нормальной производительности.

Какие модели предлагает DeepSeek?

· DeepSeek-V3: Построена на архитектуре Mixture-of-Experts (MoE) и оптимизирована для многозадачности — от программирования до математических вычислений и работы с разными языками.

· DeepSeek-R1: специализируется на логическом мышлении и решении сложных задач, используя оптимизированное обучение с подкреплением.

Из минусов долгое ожидание ответа, периодические сбои из-за сильной нагрузки на сервера. Очень много отзывов из разряда «на третьем запросе ответы стали хуже» и «данные не актуальны». Китайцы тестят свой продукт, но пока что он на стадии развития. Безусловно шансы на эволюцию есть, однако надо ждать, а пока можно побаловаться.

Последний немаловажный вопрос: может ли Deep Seek генерить картинки? Сама нейросеть не может, на данный момент компания разработала отдельную модель Janus Pro (cразу чувствуется, что с неймингом у китайцев всё в порядке)). Пока модель ограничена и создаёт картинки размером 384×384 пикселя, что маловато, но текст формирует лучше, чем DALL-E от Open AI.

Дик пик… DeepSeek: как переродился «Синий кит», но в виде нейросети. Блог Красовского - полный разбор.

По итогу мы имеем нейросеть, которую можно развернуть локально, однако всё ещё с недочётами, но это вопрос времени. Рынок держит участников в узде, поэтому по правилам самурая цели нет, есть только путь, по которому компании будут совершенствовать свой продукт. Ждём, когда Deep Seek объединит генерацию картинок и текстовые запросы и будем сравнивать через полгода.

Если у вас уже был опыт работы с Deep Seek и Chat GPT, пишите в комментариях, какие задачи они закрывали эффективнее.

В своём телеграм канале пишу про новости в сфере IT и автоматизации, подписывайтесь, чтобы не пропустить)

21
7
1
25 комментариев

"Я бы сказал, что Deep Seek на данный момент хорош для решения креативных задач, связанных с кодом и вычислениями, если лень включать VPN или нет возможности пользоваться платным GPT."

Во, хоть кто-то толком привязал инфоповод к практической жизни )))

5

Точно, а то все одно и тоже

1

На этой неделе как раз давал комментарии журналистам про утечки информации из этой нейронки

4

О, очень интересно. Дайте ссылку!

То, что они не защищают данные и говорят, что модель учится на них, конечно, огромный минус.
Но как работает моделька, мне очень нравится.

классно расписал;))

2