Хотя некоторые исследователи считают, что рано или поздно мы исчерпаем возможности обучать модели из-за недостатка токенов, но это произойдет только в будущем, и к этому времени мы найдем другие способы обучать модели. Источники данных, такие как Reddit, Twitter ценны, мульти-модальный подход может быть очень перспективным в будущем. Вопрос о том, где мы еще не получили токены, остается нерешенным.
Спасибо, круто. Интервью не осилил, а выжимку почитать было интересно.
А о каком выравнивании идёт речь в статье? Это про распределение весов?