Большие языковые модели стали медленнее «умнеть», потому что «кончились данные для обучения» — MTS AI

Чем сложнее модель, тем больше данных нужно, чтобы улучшить качество её работы.

Источник фото: РБК
55
22

Там на книгах не выходит учить? Или на материалах из научных изданий? Главное не актуальность. А если с такими знаниями зашли в тупик, то явно где-то упущение

4
Ответить

Думаете шизиков не публикуют?

1
Ответить

Большинство книг защищены авторским правом, поэтому за такую коллекцию придется отвалить состояние, а информация там порой устаревшая. Уже сейчас появляются иски, что в материалы для обучения нейронки попадали вещи, за которые никто не платил.

Про научные издания идея неплохая, но их немного и это покроет ну от силы процентов 5 нужд пользователей. А данных нейронке нужно много и из самых разных областей, поскольку спектр предполагаемых задач - огромен. Ну и если текущего объема информации в интернете недостаточно, то можешь представить сколько потенциально таких книг и научных изданий нужно для нейронки, чтобы покрыть потребность)

Ответить