Почему пора прекратить ссылаться на SimilarWeb. Разбор материала Tutu.ru

Всем привет. Это статья о том, почему не стоит делать «исследования» трафика через SimilarWeb и вообще сильно доверять данным, которые выдает этот ресурс.

У меня давно много вопросов к тем, кто для аналитики российского трафика использует SimilarWeb, и как раз на днях автор из Tutu.ru опубликовал кейс, на примере которого это можно обсудить. Статья была посвящена разбору того, как Яндекс отбирает трафик у аналогичных сервисов через «колдунщиков».

Для справки стоит пояснить, что Tutu является одной из компаний, которые пожаловались за это на Яндекс в ФАС. На мой взгляд, совершенно оправдано: поисковая выдача, в контексте продвижения сервисов, — вещь, мягко скажем, неоднозначная. Материал должен был проиллюстрировать обоснованность претензии, но вместо этого оказался «аналитикой на коленке», построенной на передергиваниях. Но обо всем по порядку.

Начнем с первого графика в статье Tutu и сравним его с данными самого SimilarWeb.

Почему  пора прекратить ссылаться на SimilarWeb. Разбор материала Tutu.ru

На графике в статье мы видим, что примерно с июня прошлого года ни одна «синяя» линия не превосходит 50%, то есть все сервисы без исключения получают более половины поискового трафика из Google. Нет ли тут ошибки?

Конечно, есть, и автор статьи не мог об этом не знать.

Почему  пора прекратить ссылаться на SimilarWeb. Разбор материала Tutu.ru

Прямо сейчас SimilarWeb сообщает, что Tutu получает более 70% поискового трафика из Яндекса.

За месяц с декабря 2020 по январь 2021 (данные, доступные любому пользователю в пробной версии) показания приборов SimilarWeb поменялись на десятки процентов. Tutu не единственный пример несоответствия. Среди всех приведенных на графике сервисов нет ни одного, для которого SimilarWeb теперь сообщал бы цифру ниже 50%. Новые показания оказываются противоположными по смыслу и гораздо более близкими к реальности: Яндекс ведет больше трафика, чем Google, на каждый из «синих» сервисов.

Почему  пора прекратить ссылаться на SimilarWeb. Разбор материала Tutu.ru

Вот, например, ivi.ru.

Естественно, это означает, что делать выводы по данным SimilarWeb следует крайне осторожно и с множеством оговорок, а недобросовестный cherry picking из них может «доказать» любую позицию.

Например, в своей статье авторы сравнивают Tutu с Яндекс.Путешествиями. Это неверно как с точки зрения SimilarWeb, так и с точки зрения здравого смысла: лишь небольшое число посетителей Tutu из поиска действительно планирует путешествие, а не просто смотрит расписание своей электрички или поезда. Давайте признаем, что настоящим аналогом Туту среди сервисов Яндекса является сервис расписаний rasp.yandex.ru, и как раз тут с мнением SimilarWeb, который предлагает его в качестве альтернативного, можно согласиться:

Почему  пора прекратить ссылаться на SimilarWeb. Разбор материала Tutu.ru

И, сюрприз (хотя, конечно, нет): цифры для аналогичных сервисов совпадают с точностью до одного процента.

Почему  пора прекратить ссылаться на SimilarWeb. Разбор материала Tutu.ru

Эти данные мог бы (и всё ещё может) проверить любой, кто прочитает статью: pro.similarweb.com даётся на неделю бесплатно.

Ну и отдельно меня смутила цифра по отказам. Не очень понятно, что она должна означать — и, как справедливо писали в комментариях к статье Tutu — никто про это до конца ничего не понимает. Если среди читателей есть вебмастера — будет любопытно посмотреть, что показывают разные счетчики по одному и тому же сайту. Пока есть ощущение, что показатели SimilarWeb несколько оторваны от реальности.

Напоследок хочется отметить, что не стоит переоценивать роль поиска — это уже далеко не ключевой инструмент, который приводит трафик на сайт. И те, кто все еще так думает, застряли в прошлом. Огромную долю держат те же мобильные приложения, аудитория сегментируется и уходит в соцсети, Телеграм-каналы — надо развивать её там, снижать зависимость от сервисов конкурентов. Кстати, мобильный трафик SimilarWeb тоже считает криво. И, насколько мне известно, почти не учитывает Safari.

Я уже оставил этот комментарий к посту ранее, но, пожалуй, повторю мысль. Когда колдунщик Яндекса занимает полстраницы поиска — это не выглядит как равные условия. Но строить свою аналитику на SimilarWeb нельзя: как инструмент он очень плохо подходит для российского рынка, и это прекрасно знает любой, кто хоть что-то понимает в веб-сайтах. Вот у вас в браузере стоит расширение, передающее данные SimilarWeb? Или, может, вы знаете вы кого-нибудь, у кого оно стоит? Я тоже нет. Поэтому при их точности данных — это уже не аналитика. А строить аргументацию на фейковых инструментах — это абсолютная манипуляция.

4242
26 комментариев

"На графике в статье мы видим, что примерно с июня прошлого года ни одна «синяя» линия не превосходит 50%, то есть все сервисы без исключения получают более половины поискового трафика из Google. Нет ли тут ошибки?" - есть. Ошибка в том, что вы неправильно поняли что именно пытался донести автор, и строите на этом какое-то исследование. В том кейсе указывается что для сравнения берутся 2 сервиса, к примеру туту и яндекс.тревел, и их общий трафик из яндекс поиска принимается за 100%, а не то, что из яндекса туту получает всего 45% своего поискового трафика. Так что туту может хоть 90% трафика получать из яндекса, но при этом в сравнении с яндекс.тревел - иметь меньше посетителей.

10
Ответить

А как получилось так, что линия выше 90% есть, а ниже 10% - нет?

Ответить

А как у вас получилось 100%? На графике никакие синие показатели так не суммируются. Например, есть красная линия с 90%, но нет ни одной синей с 10%. Мне кажется, что все эти графики — это все-таки доля Яндекса в общем поисковом трафике. Если нужно было бы показать соотношение источников трафика на сайт, то тут скорее бы классический "пирог" подошёл бы для визуализации, но его не получится из этих данных

Ответить

Работаю с SimilarWeb каждый день, и дам пару комментариев по вашему посту.

1. Вы берете данные из отчета Search Traffic и сравниваете его данными по реферальным переходам.
НО: в разделе Search Traffic есть возможность сегментации по 2м данным о трафике: декстоп и мобайл (без выбора всего трафика, по умолчания - декстоп), а в реферальном - весь трафик. От сюда не соответствие в % поискового трафика.

2. Процент отказов - сравниваете со значением отказов G.Analytics (т.к. у SimilarWeb механика по отказам аналогична)

Строить кейс на основе SimilarWeb - это странно и некоректно, т.к. это иснтрумент приблизительного анализа и мониторинга, а для кейса - нужны точные данные.

Что касается РУ сайтов - это не самый точный инструмент, но его данных достаточно для получения приблизительного понимания и анализа конкурентов. Для зарубежных сайтов - отличный инструмент.

6
Ответить

И тут наверно стоит сделать оговорочку, что автор кейса https://vc.ru/seo/225449-yandeks-ne-runet-runet-ne-yandeks-fas-poprosila-nemnogo-ravnopraviya и свой сайт сравнивает через similarweb, то есть, с точки зрения некорректности данных оба сервиса, и яндекс.тревел, и туту - находятся в равных условиях.

1
Ответить

Данные SimilarWeb очень приблизительны, а для российского рынка часто вообще неточны. Мне кажется, это связано с тем, что в качестве источников данных, которые они экстраполируют, выступают в основном зарубежные англоговорящие панелисты и сервисы соответственно.

Из-за этого с российскими веб-ресурсами такая беда :(

3
Ответить

>Вот у вас в браузере стоит расширение, передающее данные SimilarWeb? Или, может, вы знаете вы кого-нибудь, у кого оно стоит?

И как же вы это можете понять? Думаете все расширения, сливающие данные, открыто это афишируют?

Про similar web есть вот такое, например, расследование:

In March 2016 we noticed a website that offered information similar to analytics sites, but had no apparent relation to the sites that were analyzed – www.similarweb.com. The data includes links clicked on a site, referrer statistics, the origin of users, and others. While this is interesting, it also raises questions about the sources of data. Based on their website they collect data from millions of devices, but the software they advertise has a number of installations that was orders of magnitude lower than that. Through analysis of their official Chrome extension we
noticed a tracking library performing real-time monitoring of all visited websites. In a subsequent analysis of the top Chrome and Firefox extensions we found the library present in both official stores. We found the same library in 42 extensions in the Chrome Web Store and five extensions
in the Mozilla store, in total over 8 million installations.

Почти уверен, что в хром сторе масса бесплатных расширений, которые монетизируются, сливая данные пользователей. В тч и similarweb.

2
Ответить