Конечно, локальные нейросети гораздо меньше облачных и возможности у них не такие интересные. Но исследователи ищут способы, которые позволили бы большим языковым моделям работать, даже если память ограничена. Например, инженеры Apple недавно научили LLM-нейросеть Falcon 7B выдавать данные в четыре-пять раз быстрее при объеме памяти вдвое ниже, чем требовалось.