Большой Отец

с 2023

1 подписчик

0 подписок

Большой Отец

в посте

Emu от Meta VS Midjourney 5.2: какой ИИ-генератор изображений лучше?13.11.2023

Очень весёлый клоун, насмешил меня знатно своими формулировками

Ответить

Большой Отец

в посте

Запускаем LLaMa 2 70B GPTQ на двух GPU 24 Gb (для новичков)09.10.2023

Впервые вижу что кто-то затрагивает тему что интеллект модели падает при кванте, хоть и говорят об этом. Есть какие-то примерные данные сколько теряется в процентах интеллекта у модели? От q8 до q4 к примеру. Если не ошибаюсь, это 10% до q4, и чем цифра ниже, тем сильнее падает производительность по схеме лавины.

Так же слышал что чем крупнее модель, тем её квант в более компактные варианты вредит ей меньше. Типо, квантовка 70b до q2 превращает её в овоща, а нового 180b Falcon страдает от этого на много меньше.

Речь в целом идёт об ggml и gguf. Только такие и могу запускать

Ответить