ChatGPT против DeepSeek: кто умнее тратит деньги и дает советы по инвестициям?

В последние годы искусственный интеллект (ИИ) стал неотъемлемой частью нашей жизни, предлагая решения от автоматизации задач до создания творческого контента. Среди множества ИИ-моделей особое внимание привлекают две: ChatGPT от американской компании OpenAI и DeepSeek от китайского стартапа High-Flyer. Обе модели демонстрируют впечатляющие возможности, но различаются по объему инвестиций в их разработку и подходам к инвестиционным рекомендациям. Давайте рассмотрим эти аспекты подробнее.

Инвестиции в разработку

Компания OpenAI вложила значительные средства в разработку ChatGPT. По оценкам, обучение модели GPT-4 обошлось более чем в $100 миллионов. Такие инвестиции позволили создать мощную и универсальную модель, способную решать широкий спектр задач.

В отличие от этого, китайский стартап High-Flyer смог создать DeepSeek, потратив на обучение модели около $5,6 миллионов. Обучение заняло всего два месяца, что значительно быстрее и дешевле по сравнению с западными аналогами. Такая эффективность достигнута благодаря использованию оптимизированных архитектур и методов обучения.

Подходы к инвестиционным рекомендациям

ChatGPT ориентирован на осторожные и диверсифицированные стратегии инвестирования. Рекомендует распределять капитал между различными активами, снижая риски и обеспечивая стабильный доход. Например, при запросе о вложениях в технологический сектор ChatGPT может посоветовать инвестировать в проверенные временем компании с устойчивой репутацией.

DeepSeek склонен к более агрессивным инвестиционным стратегиям. Может предлагать вложения в высокорисковые активы с потенциалом высокой доходности, что подходит для инвесторов, готовых к повышенному риску. Например, DeepSeek может рекомендовать инвестировать в быстрорастущие стартапы или новые технологии, которые еще не получили широкого признания на рынке.

Один из пользователей отметил, что DeepSeek раздает пугающе релевантные советы по инвестированию на российском рынке, что заставило его всерьез задуматься о своей карьере.

Ответ ChatGPT и DeepSeek на вопрос, как торговать акциями на рынке РФ

Как вам такой ответ от нейросети, в которую вложили больше $100 миллионов, и от ее «бюджетного» конкурента за $5,6 миллионов?)

Технические особенности и архитектура

ChatGPT использует традиционную архитектуру трансформеров с большим количеством параметров. Это обеспечивает высокую точность и универсальность модели, но требует значительных вычислительных ресурсов для обучения и работы. Модель обучена на огромных объемах текстовых данных, что позволяет ей генерировать осмысленные и связные ответы на широкий спектр вопросов.

DeepSeek применяет архитектуру Mixture-of-Experts (MoE), которая разделяет модель на 256 независимых модулей-«экспертов». При обработке запроса активируются только 8 наиболее подходящих экспертов, что снижает вычислительную нагрузку и повышает эффективность. Кроме того, DeepSeek использует обучение с подкреплением, что позволяет модели быстрее адаптироваться к новым задачам и улучшать свои результаты на основе обратной связи.

Экономичность, инфраструктура и вызовы масштабирования: как DeepSeek оптимизировал расходы, но столкнулся с проблемами серверных мощностей

DeepSeek, в свою очередь, пошел по другому пути: они оптимизировали архитектуру и алгоритмы, чтобы снизить затраты на обработку простых запросов.

Сравнительные результаты поражают:

Затраты на обучение: не $100 млн, а $5 млн.

Количество нужных GPU: 2000 вместо 100 тысяч.

Стоимость API: на 95% дешевле.

Тип нужных GPU: подойдут и игровые — серверное оборудование дата-центров необязательно.

Это позволило обучить модель быстрее и дешевле, предлагая услуги по более доступным ценам. Однако стоит учитывать, что несмотря на экономичность обучения, у DeepSeek возникают сложности с поддержанием серверной инфраструктуры – рост числа пользователей приводит к сбоям в работе, что указывает на нехватку мощностей GPU и стабильность работы серверного оборудования.

При этом на развитие DeepSeek влияет и внешняя экономическая среда: ввоз серверного оборудования в Китай ограничен санкциями, что усложняет масштабирование. Тем не менее, если компания решит эти технические вопросы, она сможет составить более серьезную конкуренцию OpenAI.

Также из новостей: Американские власти подозревают, что китайская компания DeepSeek обходила санкции, приобретая чипы Nvidia через Сингапур. За последние три квартала продажи Nvidia в Сингапуре выросли на 740%, что вызывает вопросы о конечных получателях оборудования.

В заключение, обе модели, ChatGPT и DeepSeek, продемонстрировали значительные успехи в области искусственного интеллекта, но их подходы к разработке и инвестиционным рекомендациям, которые они дают - существенно различаются.

В итоге, выбор к кому из них прислушиваться и в какую из технологий инвестировать зависит от предпочтений инвестора, ChatGPT подойдет тем, кто ищет стабильность, а DeepSeek – тем, кто готов рискнуть ради больших возможностей.

Вряди в ближайшее время DeepSeek станет убийцей ChatGPT и удешевлением всей индустрии связанной с GPU, данными для нейросетей и самими ИИ моделями.

Подписывайтесь на канал клуба Цифровые Финансы https://t.me/+pOaDQ5HpzRw5ZDQy, там вы найдете актуальные новости про венчурные инвестиции, кейсы проектов, обучающие материалы, а также сможете обмениваться опытом с единомышленниками.