Каждый из этих источников проходит предварительную обработку (то, что мы называем препроцессингом данных) и далее скармливается нужным алгоритмам. Где-то мы используем более простые подходы, например сингулярное матричное разложение (SVD), а где-то полноценные нейронные сети. Так, при обработке данных из VK мы применяем модифицированную версию BERT, которая предназначена для анализа и предварительной обработки описаний пабликов.