В сливе кода Яндекса нашли факторы ранжирования

В интернете оказались фрагменты исходного кода многих сервисов Яндекса — это называют самым масштабным сливом в истории компании.

В сливе кода Яндекса нашли факторы ранжирования

Привет, это PR-CY! Мы создатели сервиса, который помогает улучшить сайт и выйти в топ. Он ищет проблемные URL, проверяет SEO сайта и следит за позициями. В блоге делимся кейсами, советами и иногда новостями. Как сейчас)

Недавно слили исходный код, принадлежащий Яндексу, и, что самое интересное, в этой базе нашли факторы ранжирования поисковой системы.

Сеошники, которые оптимизируют сайты под Яндекс

В публичный доступ попали 1922 фактора ранжирования: 244 из них неиспользуемые (unused), а 988 отмененные (deprecated), в остатке 690 факторов.

Все находится в файле, включающим название, ссылку на внутреннюю Вики с закрытым доступом, AntiSeoUpperBound и описание.

Интересно почитать, что нашли в слитом коде, но все-таки это не прикладной список, который нужно брать на вооружение. Как минимум, мы не знаем настоящую актуальность данных и степень влияния каждого фактора на оценку алгоритмом.

Что может влиять на ранжирование сайта в Яндексе

Список большой, но вот часть факторов:

  • PageRank;
  • пессимизация (сильная сводит PageRank до нуля);
  • обратные ссылки (с главных страниц важнее, чем с внутренних);
  • баланс хороших и плохих ссылок;
  • анкоры обратных ссылок;
  • возраст ссылок;
  • трафик и процент органического трафика;
  • наличие трафика из Википедии;
  • средняя позиция домена по всем запросам;
  • надежность хоста (чем меньше ошибок 40x/50x, тем лучше);
  • возраст документа, дата его последнего обновления;
  • количество / в URL (много — плохо);
  • цифры в URL (цифры — плохо);
    *мы тоже не знаем почему, какие и насколько это важно 🤷‍♂
  • ключевые слова в URL (оптимально до трех слов);
  • уровень вложенности URL;
  • пользовательские факторы: CTR, last-click, добавление в закладки;
  • количество поисковых запросов;
  • наличие карт js-api на странице (например, Google Maps);
  • встроенное видео на странице (наличие — хорошо, поврежденное — плохо);
  • количество рекламы на странице;
  • качество текста;
  • и другие факторы. Например, случайность попадания в топ, чтобы проверить, как пользователи реагируют на результат. Поэтому не спешите связывать внезапный рост позиций с тем, что вы делали на странице до этого, это может быть совпадением. 🤷‍♂

📖 Ссылки, где почитать подробнее:
Больше пунктов с подробностями в материале Liftweb.
И на зарубежном сайте, где сделали поиск по всем факторам.

Официальный комментарий компании Яндекс

Яндекс выложили пресс-релиз на своем офицальном сайте с объяснением ситуации. По ссылке весь текст с пояснением, извинениями и планами, а здесь цитаты, которые мы выбрали:

«Опубликованные фрагменты действительно взяты из нашего внутреннего репозитория <...>. При этом содержимое архива соответствует устаревшей версии репозитория — она отличается от актуальной версии, которая используется нашими сервисами».
«Сложившаяся ситуация — повод провести масштабный аудит всего содержимого репозитория».

«Зафиксированы случаи, когда логику работы сервисов корректировали не алгоритмическим способом, а «костылями» <...>. Через такие «костыли» исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео».

«Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но сами по себе оскорбительны для людей разных рас и национальностей».

«Мы исходим из того, что любой внутренний диалог, документ или исходный код при определённых обстоятельствах может стать публичным. И если это случится, нам не должно быть стыдно.

Сейчас нам очень стыдно, и мы приносим извинения нашим пользователям и партнёрам».

Будет интересно почитать ваши комментарии о причине такого масштабного слива и о самих факторах ранжирования: какие-то вас удивили или весь перечень посредственный?

Оцените пост, подпишитесь на блог и попробуйте сервис для анализа сайта. :) Ваши PR-CY.

1313
46 комментариев

Комментарий недоступен

5
Ответить

Ссылки с морд , работали и работают 😂👌

Ответить

Положа руку на сердце — что нового вы узнали из этого списка факторов? :)
Такое множество факторов, работающих в совокупности, не позволяет гарантировать точное влияние на результат каждого из них.
Недавно читала исследования одного сеошника по гуглу: в одном случае фактор А работает в плюс, в другом он же - в минус/никак.
*
Вероятно, наибольшую ценность имеет сам код, но для тех, кто может им воспользоваться.

3
Ответить

ничего нового. еще раз подтвердилось, что самый главный фактор - это бабки. все эти факторы ранжирования заточены не облегчать жизнь, а усложнять, а иначе их не было бы столько

2
Ответить

Плюс всеми этими факторами рулит нейросеть со своей логикой.

1
Ответить

Извините, а вы что предыдущую статью Петра Гришечкина отрерайтили? Один в один с его статьей.

2
Ответить

Нет, впервые его вижу, честно сказать.
Этот пост собран из новостей с разных источников, их все друг у друга рерайтят, потому что ну это новость, там ничего не придумаешь от себя))

Ответить