Он скупал видеокарты и обучал ИИ ещё до «бума нейросетей».Лян Вэньфэн — справаЛян Вэньфэн (梁文锋 или Liang Wenfeng) родился в 1985 году в Чжанцзяне, провинция Гуаньдун. Его родители работали учителями китайского языка в начальных классах.В школе у Ляна возник интерес к математике, а позже он отучился в местном университете, где получил степени бакалавра и магистра по информационной и коммуникационной инженерии. Специализировался Лян на машинном зрении.По рассказам знакомых, в студенчестве предприниматель был «замкнутым и нелюдимым», но несмотря на это, в 2008 году, в разгар финансового кризиса, Лян Вэньфэн собрал команду из своих одногруппников для сбора данных о финансовых рынках. Вместе они пытались использовать машинное обучение для количественного трейдинга — стратегии торговли, в которой используются математические модели и алгоритмы.Лян Вэньфэн всегда верил, что «ИИ изменит мир», но тогда у него не было единомышленников, а многие даже посмеивались и говорили ему, что он «смотрит слишком много научной фантастики».Алгоритмическая торговля и покупка видеокартПосле учёбы Лян пробовал придумывать идеи для применения ИИ в разных сферах, пока не остановился на финансах. В 2015 году предприниматель соосновал хедж-фонд High-Flyer — он использовал искусственный интеллект, чтобы принимать инвестиционные решения и предугадывать тренды на рынке. Название компании на китайском — 幻方 или «магический квадрат».В 2019 году фонд основал компанию High-Flyer AI для изучения ИИ в алгоритмическом трейдинге и вложил 200 млн юаней (это примерно 2,6 млрд по курсу ЦБ на 29 января 2024 года) в разработку модели Yinghuo, для которой компания закупила 1100 графических процессорах от Nvidia. А в 2021 году инвестировал ещё 1 млрд юаней (13,4 млрд рублей) в Yinghuo 2, для которой купили уже 10 тысяч видеокарт.К этому времени в управлении High-Flyer были активы на 100 млрд юаней (1,3 трлн рублей). А для торговли компания использовала только ИИ — и работала по примеру Renaissance Technologies, которая специализируется на торговле при помощи математических и статистических методов.Как объяснял Лян, видеокарты для обучения моделей он покупал в основном из любопытства, а не из-за тайной бизнес-логики: ему было интересно узнать, как далеко может зайти ИИ. По его словам, для сторонних наблюдателей именно OpenAI с ChatGPT перевернули отрасль, но тем, кто давно интересовался ИИ, ещё на выпуске GPT-3 в 2020 году стало понятно, что искусственному интеллекту понадобятся огромные вычислительные мощности. И всё же «большинство» недоумевало, зачем Лян Вэньфэн тратит деньги на графические процессоры.Как появился DeepSeekСколотив неплохое состояние на алгоритмической торговле, Лян Вэньфэн решил вернуться к идее исследований общего ИИ (AGI): в 2023 году он объявил, что создаст компанию DeepSeek, которая не будет связана с трейдингом и отделится от High-Flyer.При найме новых сотрудников компания ориентируется не на опыт, а на «страсть» к работе и прикладные навыки. Большинство работников — недавние выпускники или начинающие специалисты.В мае 2024 года фирма выпустила модель DeepSeek-V2, в ноябре — DeepSeek-V3, а в январе 2025-го — «думающую» DeepSeek-R1, которая решает задачи по математике и программированию «лучше» или на уровне o1 от OpenAI.#deepseek #новости
Я думал этот
ДЗАНЯЯЯЯЯЯЯНГ!!!
Самый прагматичный чувак в фильме
Не хот-дог
Откуда, не подскажите?
Все смотрели, все поняли. Чего?
Выяснится, что прост спиздил все данные у опенаи. Надрочил свою модель - и поджёг пердак Альтмана. Красава!