Иногда требуется, чтобы GPU работал с меньшей мощностью. Например, при слишком долгом трэйне не хочется перегревать карту. Либо GPU со слабой заводской системой охлаждения и всегда сильно греется при максимальных нагрузках. Также в летнее время в комнате без кондиционера будет полезно. Еще один случай: несколько видеокарт слишком близко. Могут случится все факторы сразу.В Linux системах можно понизить мощность Nvidia GPU стандартной утилитой nvidia-smi, которая входит в пакет драйверов. Например, команда для OS Ubuntu:sudo nvidia-smi -pl 300Где 300 это любое число в ваттах, выше которого не будет потребление. Действует сразу на все установленные карты Nvidia. После перезагрузки компьютера значение сбрасывается к заводскому.Как измерить температуру GPU?В Linux cамый простой способ наблюдения за температурой это запустить nvidia-smi через watch с обновлением в 1 секунду.watch -n 1 nvidia-smiЕжесекундной обновление nvidia-smiКак снижается производительность карты при понижении мощности?Данные теста для 2 х Gainward RTX 3090 Phoenix 24G NVlink, режим работы видеокарты P2 (Balanced 3D performance-power).Сравнительная таблица понижения мощности.При уменьшении почти на 30% мощности GPU, трэйн выполнился на 20% дольше. Выигрыш в температуре существенный 7-10 градусов. Более длительные, многочасовые задачи могут дать другие данные в том числ.Какие пределы температур безопасны?Пределы рабочей температуры отличаются внутри одной серии в зависимости от производителей. Более качественная система охлаждения сказывается и на стоимости. Карты NVIDIA GTX 10-й серии, например, имеют максимальную температуру 94C, а карты RTX 20-й серии имеют максимальную температуру всего 88C.Разные специалисты указывают, что безопасная для RTX 3090 температура находится в пределах до 85C при 100% нагрузке.Nvidia публикует максимальную температуру видеокарты Founders Edition 3090 в 93 градуса.С помощью команды:nvidia-smi -i 0 -qМожно увидеть какие предельные температуры возможны для текущей видеокарты. Для моей RTX 3090:Температура выключения (GPU Shutdown Temp) - 98 С. Температура замедления (GPU Slowdown Temp) - 95. Максимальная рабочая температура - 93 С. Рекомендуемая температура - 83 С.
А можете ли вы уточнить, это температура по хотспоту или в целом по чипу?
По данным nvidia-smi