На борту сразу 2 апдейта: Core Update + Spam Update (2 в 1). Это обновление основного алгоритма Google и алгоритма антиспама одновременно.
Если про обновление основной алгоритма нам никто ничего не расскажет, то по обновлению антиспама Google выпустил интересный пост в своём блоге.
Публикую самое важное (интересное) :
По первому пункту, думаю, будет опять замах на рубль, а удар на копейку.
Грозные утверждения по поводу того, что будет наказываться даже сочетание генережки и ручного труда, на мой взгляд, является вообще сомнительным утверждением со стороны Гугла. Что считать такой комбинацией? Если AI набросал структуру контента, а человек написал, то это тоже попадает под их критерии спама? Думаю нет. Если был сгенерирован текст и основательно дописан/переработан – скорее всего тоже нет.
Вообще интересует алгоритмическая реализация такого процесса, поскольку он должен быть не только эффективным, но и не сильно ресурсозатратным. Вероятно будет что-то типа дообученного BERT на генеренных текстах. Если так, то с точки зрения ресурсов будет иметь смысл использовать его, условно, в рамках топ 10–30 как надстройку для уточнения весов уже первично отранжированных результатах. Опять же, слабо представляется датасет, который мог использоваться для обучения модели с целью детектирования текстов, созданных по гибридному методу (человек+AI) с существенной переработкой текста.