Влияние генеративного ИИ на окружающую среду

Быстрая разработка и внедрение мощных моделей генеративного ИИ влечет за собой экологические последствия, включая увеличение спроса на электроэнергию и потребление воды.

Волнение вокруг потенциальных преимуществ генеративного ИИ, от повышения производительности труда до продвижения научных исследований, трудно игнорировать. Хотя взрывной рост этой новой технологии позволил быстро внедрить мощные модели во многих отраслях промышленности, экологические последствия “золотой лихорадки” генеративного ИИ по-прежнему трудно определить, не говоря уже о смягчении последствий.

Создано с помощью сервиса <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fkolersky.com%2Fmj&postId=1769131" rel="nofollow noreferrer noopener" target="_blank">midjourney</a>  от KolerskyAI
Создано с помощью сервиса midjourney  от KolerskyAI

Вычислительная мощность, необходимая для обучения генеративных моделей ИИ, которые часто имеют миллиарды параметров, таких как GPT-4 OpenAI, может потребовать ошеломляющего количества электроэнергии, что приводит к увеличению выбросов углекислого газа и нагрузки на электрическую сеть.

Более того, внедрение этих моделей в реальные приложения, позволяющее миллионам людей использовать генеративный ИИ в повседневной жизни, а затем точная настройка моделей для повышения их производительности потребляет большое количество энергии еще долгое время после разработки модели.

Помимо потребности в электроэнергии, требуется большое количество воды для охлаждения оборудования, используемого для обучения, развертывания и точной настройки моделей генеративного ИИ, что может привести к перегрузке муниципальных систем водоснабжения и нарушению местных экосистем. Растущее число приложений с генеративным ИИ также стимулировало спрос на высокопроизводительное вычислительное оборудование, добавляя косвенное воздействие на окружающую среду от его производства и транспортировки.

“Когда мы думаем о воздействии генеративного ИИ на окружающую среду, речь идет не только об электроэнергии, которую вы потребляете, когда подключаете компьютер к сети. Существуют гораздо более широкие последствия, которые выходят на системный уровень и сохраняются в зависимости от предпринимаемых нами действий ”, - говорит Эльза А. Оливетти, профессор кафедры материаловедения и инженерии и руководитель миссии по декарбонизации нового климатического проекта Массачусетского технологического института.

Оливетти является старшим автором статьи 2024 года “Последствия генеративного ИИ для климата и устойчивости”, написанной в соавторстве с коллегами из Массачусетского технологического института в ответ на призыв всего института подготовить статьи, в которых исследуется преобразующий потенциал генеративного ИИ как в положительном, так и в отрицательном направлениях для общества.

Требовательные центры обработки данных

Потребность центров обработки данных в электроэнергии является одним из основных факторов, влияющих на воздействие генеративного ИИ на окружающую среду, поскольку центры обработки данных используются для обучения и запуска моделей глубокого обучения, лежащих в основе популярных инструментов, таких как ChatGPT и DALL-E.

Центр обработки данных - это здание с регулируемой температурой, в котором размещается вычислительная инфраструктура, такая как серверы, накопители данных и сетевое оборудование. Например, Amazon располагает более 100 центрами обработки данных по всему миру, в каждом из которых около 50 000 серверов, которые компания использует для поддержки сервисов облачных вычислений.

Хотя центры обработки данных существуют с 1940-х годов (первый был построен в Пенсильванском университете в 1945 году для поддержки первого цифрового компьютера общего назначения, ENIAC), развитие генеративного ИИ резко ускорило темпы строительства центров обработки данных.

“Что отличает генеративный ИИ, так это требуемая для него плотность мощности. По сути, это просто вычисления, но учебный кластер с генеративным ИИ может потреблять в семь-восемь раз больше энергии, чем обычная вычислительная нагрузка ”, - говорит Номан Башир, ведущий автор статьи impact, который является научным сотрудником по вычислениям и влиянию на климат в Консорциуме MIT по климату и устойчивому развитию (MCSC) и постдоком в Лаборатории компьютерных наук и искусственного интеллекта (CSAIL).

Ученые подсчитали, что потребности в электроэнергии центров обработки данных в Северной Америке увеличились с 2688 мегаватт в конце 2022 года до 5341 мегаватт в конце 2023 года, частично из-за потребностей генеративного ИИ. Во всем мире потребление электроэнергии центрами обработки данных выросло до 460 тераватт в 2022 году. По данным Организации экономического сотрудничества и развития, это сделало бы центры обработки данных 11-м по величине потребителем электроэнергии в мире, между странами Саудовской Аравии (371 тераватт) и Франции (463 тераватт).

Ожидается, что к 2026 году потребление электроэнергии центрами обработки данных приблизится к 1050 тераватт (что поднимет центры обработки данных на пятое место в глобальном списке между Японией и Россией).

Хотя не во всех вычислениях в центрах обработки данных используется генеративный ИИ, эта технология стала основным фактором увеличения спроса на энергию.

Спрос на новые центры обработки данных не может быть удовлетворен устойчивым образом. Темпы, с которыми компании строят новые центры обработки данных, означают, что основная часть электроэнергии для их питания должна поступать от электростанций, работающих на ископаемом топливе

Башир

Мощность, необходимая для обучения и развертывания модели, подобной GPT-3 OpenAI, определить сложно. В исследовательской работе 2021 года ученые из Google и Калифорнийского университета в Беркли подсчитали, что только на процесс обучения потребляется 1287 мегаватт-часов электроэнергии (этого достаточно для питания примерно 120 среднестатистических домов в США в течение года), в результате чего образуется около 552 тонн углекислого газа.

Хотя все модели машинного обучения должны быть обучены, одной из уникальных проблем генеративного ИИ являются быстрые колебания в потреблении энергии, которые происходят на разных этапах процесса обучения, объясняет Башир.

Операторы электросетей должны иметь способ поглощать эти колебания для защиты сети, и они обычно используют дизельные генераторы для этой задачи.

Усиливающееся воздействие логического вывода

После обучения модели генеративного ИИ потребности в энергии не исчезают.

Каждый раз, когда модель используется, возможно, человеком, который просит ChatGPT обобщить электронное письмо, вычислительное оборудование, выполняющее эти операции, потребляет энергию. Исследователи подсчитали, что запрос ChatGPT потребляет примерно в пять раз больше электроэнергии, чем простой поиск в Интернете.

“Но обычный пользователь не слишком задумывается об этом”, - говорит Башир. “Простота использования интерфейсов генеративного ИИ и отсутствие информации о воздействии моих действий на окружающую среду означают, что у меня, как у пользователя, нет особого стимула сокращать использование генеративного ИИ”.

При традиционном ИИ потребление энергии распределяется довольно равномерно между обработкой данных, обучением модели и выводом, который представляет собой процесс использования обученной модели для составления прогнозов на основе новых данных. Однако Башир ожидает, что потребность в электроэнергии для генеративного вывода ИИ в конечном итоге будет доминировать, поскольку эти модели становятся повсеместными во многих приложениях, а потребление электроэнергии, необходимой для вывода, будет увеличиваться по мере того, как будущие версии моделей станут больше и сложнее.

Кроме того, модели с генеративным ИИ имеют особенно короткий срок годности, что обусловлено растущим спросом на новые приложения с ИИ. Компании выпускают новые модели каждые несколько недель, поэтому энергия, использованная для подготовки предыдущих версий, тратится впустую, добавляет Башир. Новые модели часто потребляют больше энергии для обучения, поскольку они обычно имеют больше параметров, чем их предшественники.

Хотя потребности центров обработки данных в электроэнергии, возможно, привлекают наибольшее внимание в исследовательской литературе, количество воды, потребляемой этими объектами, также оказывает воздействие на окружающую среду.

Охлажденная вода используется для охлаждения центра обработки данных за счет поглощения тепла от вычислительного оборудования. Было подсчитано, что на каждый киловатт-час энергии, потребляемой центром обработки данных, потребуется два литра воды для охлаждения, говорит Башир.

То, что это называется "облачными вычислениями", не означает, что оборудование живет в облаке. Центры обработки данных присутствуют в нашем физическом мире, и из-за использования ими воды они оказывают прямое и косвенное влияние на биоразнообразие

Башир

Вычислительное оборудование внутри центров обработки данных оказывает собственное, менее прямое воздействие на окружающую среду.

Хотя трудно оценить, сколько энергии требуется для производства графического процессора, типа мощного процессора, способного справляться с интенсивными рабочими нагрузками генеративного ИИ, это будет больше, чем необходимо для производства более простого центрального процессора, поскольку процесс изготовления более сложный. Углеродный след графического процессора усугубляется выбросами, связанными с транспортировкой материалов и продукции.

Получение сырья, используемого для изготовления графических процессоров, также имеет экологические последствия, что может быть связано с грязными процедурами майнинга и использованием токсичных химикатов для обработки.

По оценкам исследовательской компании TechInsights, три основных производителя (NVIDIA, AMD и Intel) в 2023 году поставили в центры обработки данных 3,85 миллиона графических процессоров по сравнению с примерно 2,67 миллиона в 2022 году. Ожидается, что в 2024 году это число увеличится еще на больший процент.

Отрасль находится на неустойчивом пути, но есть способы стимулировать ответственную разработку генеративного ИИ, который поддерживает экологические цели, говорит Башир.

Он, Оливетти и их коллеги из MIT утверждают, что для этого потребуется всестороннее рассмотрение всех экологических и социальных издержек, связанных с генеративным ИИ, а также детальная оценка ценности его предполагаемых преимуществ.

Нам нужен более контекстуальный способ систематического и всестороннего понимания последствий новых разработок в этой области. Из-за скорости, с которой происходили улучшения, у нас не было возможности наверстать упущенное в наших способностях измерять и понимать компромиссы

Оливетти
1
Начать дискуссию