ИИ — пожиратель энергии, но DeepSeek может это изменить?

🔥 Еще больше интересного в моем канале продуктовые штучки

На днях DeepSeek поразил всех заявлением о том, что его ИИ модель использует примерно одну десятую мощности, потраченной на модель Llama. Это перевернуло взгляд на то, сколько энергии и ресурсов нужно для разработки искусственного интеллекта. Не переоценена ли NVIDIA и нужны ли мегапроекты вроде Stargate?

Пока еще слишком рано судить, станет ли DeepSeek переломным моментом в вопросе воздействия ИИ на окружающую среду. Многое будет зависеть от того, как другие крупные игроки отреагируют на прорывы китайского стартапа, особенно учитывая планы по строительству новых центров обработки данных. Но попробуем разобраться в этом вопросе

Напомним, что в понедельник рынок отправил цены на акции конкурентов в крутое пике, предполагая, что DeepSeek сможет создать альтернативу Llama, Gemini и ChatGPT за малую часть бюджета. Nvidia, чьи чипы поддерживают все эти технологии, увидела, как ее акции резко упали на новостях о количестве мощностей для обучения модели DeepSeek.

Стоимость акций технологических компаний. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.axios.com%2F2025%2F01%2F31%2Fdeepseek-nvidia-ai-stocks&postId=1788071" rel="nofollow noreferrer noopener" target="_blank">Источник</a>.<br />
Стоимость акций технологических компаний. Источник.

Почему это важно?

Если утверждение о меньшей энергоемкости модели DeepSeek правда (хотя есть сомнения), оно может иметь колоссальные последствия и для развития ИИ, и для окружающей среды.

Технологические гиганты спешат построить огромные центры обработки данных ИИ, планируя, что некоторые из них будут потреблять столько же электроэнергии, сколько небольшие города. Излишне говорить, что генерация такого количества электроэнергии загрязняет окружающую среду, вызывая опасения по поводу того, как инфраструктура, лежащая в основе новых инструментов ИИ, может усугубить изменение климата и ухудшить качество воздуха.

Сокращение количества энергии, необходимой для обучения и запуска генеративных моделей ИИ, может облегчить большую часть этого нагрузки (не говоря об объемах инвестиций и ресурсов на их реализацию).

Кейс DeepSeek, кажется, показывает, что ИИ не обязательно должен быть пожирателем энергии

Какое это имеет значение для индустрии, помимо затрат энергии?

Модели DeepSeek в основном имеют открытый исходный код (за исключением данных для обучения). Это значит, что исследователи могут быстрее учиться друг у друга, и это открывает двери для более мелких игроков для входа в отрасль, у которых нет таких мощностей.

Это также создает прецедент для большей прозрачности и подотчетности, чтобы инвесторы и потребители могли более критически относиться к тому, какие ресурсы идут на разработку модели.

Поможет ли кейс DeepSeek уменьшить потребление энергоресурсов для ИИ?

Пока нет ясности. Если то, что компания заявляет правда, это может сократить общее потребление энергии центром обработки данных.

Плюс есть палка о двух концах, которую следует учитывать при рассмотрении более энергоэффективных моделей ИИ.

СЕО Microsoft Наделла написал на X о парадоксе Джевонса, согласно которому чем эффективнее становится технология, тем больше ее распространение и использование.

Апелляция к парадоксу Джевонса отнюдь не абрстрактна. Так, у OpenAI в 2024 быстрее подписок росла выручка с API: выросла в 7 раз, при том что компания несколько раз за год сбрасывала цены.

В итоге экологический ущерб растет при повышении эффективности.

Так, Дарио Амодеи, СЕО Anthropic, считает, что падение акций NVIDIA на 17% необоснованно, и успех DeepSeek не меняет правил игры.

Потребность в чипах будет только расти, а эффективность не снижает общие затраты (та же мысль, что у Наделы). Почему? В развернутом эссе он поясняет: это – не революция.

Снижение затрат соответствует обычному тренду. "DeepSeek создала модель, близкую к производительности американских моделей 7-10 месячной давности, за значительно меньшую стоимость (но не в тех пропорциях, которые все предполагали).

Дарио Амодеи. Источник

Исторический тренд снижения стоимости составляет ~4x в год, это означает, что в обычном ходе бизнеса — в нормальных трендах исторического снижения стоимости, как те, что происходили в 2023 и 2024 годах — мы бы ожидали модель в 3-4 раза дешевле, что и показал DeepSeek.

С ним согласен и ЛеКун, наблюдая за паникой инвесторов:

Реакция рынка на DeepSeek совершенно неоправданна. Паника по поводу снижения стоимости обучения преждевременна

Ян Лекун. Источник: Threads
Мнение о ситуации Я.Лекуна. Источник: Threads<br />
Мнение о ситуации Я.Лекуна. Источник: Threads

Почему? Основные затраты — идут на инфраструктуру для использования ИИ, а не на ее создание. Обслуживание ИИ-агентов для миллиардов людей требует огромных вычислительных мощностей. А значит, затраты в будущем только вырастут.

Мнение о ситуации Я.Лекуна. Источник: Threads
Мнение о ситуации Я.Лекуна. Источник: Threads

А что будет с экологией?

Независимо от того, сколько электроэнергии потребляет центр обработки данных, важно посмотреть, откуда она поступает, чтобы понять, насколько сильно она загрязняет окружающую среду. Китай по-прежнему получает более 60% своей электроэнергии из угля, а еще 3% — из газа. США также получают около 60 процентов своей электроэнергии из ископаемого топлива , но большая ее часть поступает из газа, который при сжигании создает меньше выбросов углекислого газа, чем уголь.

Энергетические компании откладывают вывод из эксплуатации электростанций на ископаемом топливе в США отчасти для того, чтобы удовлетворить стремительно растущий спрос со стороны центров обработки данных. Некоторые даже планируют построить новые газовые электростанции.

Все эти проблемы разработчики ИИ могут минимизировать, ограничив потребление энергии в целом. Традиционные центры обработки данных могли это сделать в прошлом. Несмотря на то, что рабочие нагрузки почти утроились в период с 2015 по 2019 год, спрос на электроэнергию оставался относительно стабильным в течение этого периода. Сейчас в отношении таких прогнозов больше неопределенности, но делать какие-либо выводы на основе DeepSeek на данный момент все еще остается выстрелом вслепую.

Пожалуйста, поддержите меня, поставьте лайк!

1
2
Начать дискуссию