Понижение мощности видеокарты Nvidia RTX 3090 в Linux для борьбы с перегревом

Иногда требуется, чтобы GPU работал с меньшей мощностью. Например, при слишком долгом трэйне не хочется перегревать карту. Либо GPU со слабой заводской системой охлаждения и всегда сильно греется при максимальных нагрузках. Также в летнее время в комнате без кондиционера будет полезно. Еще один случай: несколько видеокарт слишком близко. Могут случится все факторы сразу.

В Linux системах можно понизить мощность Nvidia GPU стандартной утилитой nvidia-smi, которая входит в пакет драйверов. Например, команда для OS Ubuntu:

sudo nvidia-smi -pl 300

Где 300 это любое число в ваттах, выше которого не будет потребление. Действует сразу на все установленные карты Nvidia. После перезагрузки компьютера значение сбрасывается к заводскому.

Как измерить температуру GPU?

В Linux cамый простой способ наблюдения за температурой это запустить nvidia-smi через watch с обновлением в 1 секунду.

watch -n 1 nvidia-smi
Ежесекундной обновление nvidia-smi
Ежесекундной обновление nvidia-smi

Как снижается производительность карты при понижении мощности?

Данные теста для 2 х Gainward RTX 3090 Phoenix 24G NVlink, режим работы видеокарты P2 (Balanced 3D performance-power).

Сравнительная таблица понижения мощности.
Сравнительная таблица понижения мощности.

При уменьшении почти на 30% мощности GPU, трэйн выполнился на 20% дольше. Выигрыш в температуре существенный 7-10 градусов. Более длительные, многочасовые задачи могут дать другие данные в том числ.

Какие пределы температур безопасны?

Пределы рабочей температуры отличаются внутри одной серии в зависимости от производителей. Более качественная система охлаждения сказывается и на стоимости.

Карты NVIDIA GTX 10-й серии, например, имеют максимальную температуру 94C, а карты RTX 20-й серии имеют максимальную температуру всего 88C.

Разные специалисты указывают, что безопасная для RTX 3090 температура находится в пределах до 85C при 100% нагрузке.

Nvidia публикует максимальную температуру видеокарты Founders Edition 3090 в 93 градуса.

С помощью команды:

nvidia-smi -i 0 -q

Можно увидеть какие предельные температуры возможны для текущей видеокарты. Для моей RTX 3090:

Температура выключения (GPU Shutdown Temp) - 98 С. Температура замедления (GPU Slowdown Temp) - 95. Максимальная рабочая температура - 93 С. Рекомендуемая температура - 83 С.
Температура выключения (GPU Shutdown Temp) - 98 С. Температура замедления (GPU Slowdown Temp) - 95. Максимальная рабочая температура - 93 С. Рекомендуемая температура - 83 С.
2 комментария

А можете ли вы уточнить, это температура по хотспоту или в целом по чипу?

Ответить

По данным nvidia-smi

Ответить