Понижение мощности видеокарты Nvidia RTX 3090 в Linux для борьбы с перегревом
Иногда требуется, чтобы GPU работал с меньшей мощностью. Например, при слишком долгом трэйне не хочется перегревать карту. Либо GPU со слабой заводской системой охлаждения и всегда сильно греется при максимальных нагрузках. Также в летнее время в комнате без кондиционера будет полезно. Еще один случай: несколько видеокарт слишком близко. Могут случится все факторы сразу.
В Linux системах можно понизить мощность Nvidia GPU стандартной утилитой nvidia-smi, которая входит в пакет драйверов. Например, команда для OS Ubuntu:
Где 300 это любое число в ваттах, выше которого не будет потребление. Действует сразу на все установленные карты Nvidia. После перезагрузки компьютера значение сбрасывается к заводскому.
Как измерить температуру GPU?
В Linux cамый простой способ наблюдения за температурой это запустить nvidia-smi через watch с обновлением в 1 секунду.
Как снижается производительность карты при понижении мощности?
Данные теста для 2 х Gainward RTX 3090 Phoenix 24G NVlink, режим работы видеокарты P2 (Balanced 3D performance-power).
При уменьшении почти на 30% мощности GPU, трэйн выполнился на 20% дольше. Выигрыш в температуре существенный 7-10 градусов. Более длительные, многочасовые задачи могут дать другие данные в том числ.
Какие пределы температур безопасны?
Пределы рабочей температуры отличаются внутри одной серии в зависимости от производителей. Более качественная система охлаждения сказывается и на стоимости.
Карты NVIDIA GTX 10-й серии, например, имеют максимальную температуру 94C, а карты RTX 20-й серии имеют максимальную температуру всего 88C.
Разные специалисты указывают, что безопасная для RTX 3090 температура находится в пределах до 85C при 100% нагрузке.
Nvidia публикует максимальную температуру видеокарты Founders Edition 3090 в 93 градуса.
С помощью команды:
Можно увидеть какие предельные температуры возможны для текущей видеокарты. Для моей RTX 3090:
А можете ли вы уточнить, это температура по хотспоту или в целом по чипу?
По данным nvidia-smi