Если бабушка утверждает, что денег нет (а заначку вы еще не нашли), можно ли как-то сократить расходы? Да, можно использовать квантизацию. Это техника оптимизации, которая позволяет уменьшить объем памяти, необходимый для хранения и выполнения модели, и ускорить её вычисления, обычно с небольшим ухудшением качества. Это достигается за счёт уменьшения количества бит, которые используются для представления чисел в весах модели. Квантизация чаще всего включает в себя уменьшение точности данных от 32-битных чисел с плавающей запятой до 16-битных или 8-битных целых чисел. Как правило, качество падает не значительно, но нужно смотреть на ваших конкретных задачах. Это может снизить требования к железу в 2-4 раза, но нужно экспериментировать.
Не уверена, что до конца поняла суть. Это как сказать бабушке, что надел шапку, а надеть кепку?)
))) это когда бабушка сказала надеть шапку и не важно зима или лето на дворе - нужна только шапка, а ты такой недоумеваешь и говоришь ок и предлагаешь разные виды и стоимость шапок под сезон))
хм?
Если бабушке сообщить, сколько стоит одна NVidia A100 - думаю, даст добро использовать ChatGPT
а часто так и бывает)
Ничего не понял, но очень круто и экспертно ;)
Спасибо!