Поиск точек роста для SEO и performance за счет аналитики товарных сегментов. Кейс Printbar
Когда приходишь в крупный ecom, есть стойкое ожидание, что здесь уже все есть: красивые дашборды, структурированные данные, аналитика как на ладони. Но это не так — в большинстве своем нужно делать все с нуля. Какие сложности есть в компании, где любое слово является ключевиком? Как выбрать инструменты аналитики? Да где эти ваши точки роста? Интересным кейсом поделился Евгений Горбунов, Head of SEO в Printbar, на прошедшем Optimization 2022.
Специфика проекта:
- это мерч, одежда и всё-всё-всё с рисунком, принтом, изображением
- бесконечная семантика
- нет физических товаров, а по факту их миллион
- 2 крупных игрока на рынке РФ
- ТОП10 — это либо мы и конкурент, либо партнёры
Какая была проблематика проекта:
- не было аналитики по каналам трафика в связке с другими категориями
- не было никакой семантики, нет историчности
- отчеты в Яндекс Метрике, Google и вебмастерах имеют сильную погрешность
- мало инструментов для поиска точек роста
- семантику (имеется в виду идеи) формируют смежные отделы, в том числе контекст, дизайнеры (как штатные, так и внешние) — нет единой системы
- нельзя просто так создавать +100500 товаров
- есть авторские права и лицензии
Проблематика в SEO:
- на тот период было падение трафика примерно в 2 раза
- плоская структура
- много 18+ запросов
- дубли названий у принтов = повтор карточек на первом листинге
- влияние мировых событий
- типичные SEO-проблемы: техничка, логи, мета, кф
- слабая SEO-админка
- canonical на трафиковых страницах
- уникальность контента в тематике
От руководства стояли понятные задачи: нарастить органику в 2-3 раза, настроить работу процессов и построить систему аналитики SEO (данные по каталогу, семантике, трафику, продажам и др). На старте кейса была хорошая команда — крутой IT-отдел и дизайнеры. Но вместе с этим отсутствовала сила бренда, инструменты для сквозной SEO-аналитики, стратегии и систематизации в целом. Многие процессы пришлось выстраивать с нуля, и вот как это было!
Систематизируем
Было много-много процессов, которые работали без какой-либо основы — нужна SEO-стратегия. Уже в рамках плана оптимизации быстро собирали семантику и прорабатывали критические проблемы. Далее решались на переезд каталога — уходили от плоской структуры. Формировали бэклог задач, где ключевыми у являются аналитика и фундаментальные отчеты. Определялись с инструментами — будет интересный кейс на примере DATAFORCE от SEOWORK.
Выбор инструментов
Яндекс Метрика и Google Analytics настольные инструменты SEOшника, но все-таки они не рассчитаны на загрузку огромного объема данных. Сервисы, во-первых, начинают тормозить, а во-вторых, нет фильтров для собранных сегментов. В силу неудобств аналитики этими инструментами обратились к Google Data Studio и SEOWORK.
В GDS строили дашборды, на которых отфильтровали страницы по нужным запросам, а также создали 3 фундаментальных отчета: трафик, поиск по сайту и Google Search Console (последний сервис часто используется дизайнерами проекта). Дашборды GDS довольно простые, но к их преимуществам можно отнести обработку большого массива данных без лагов, фильтр точек входа, поиск страниц вне структуры, а также фиксацию резких изменений (прирост/падение). В Printbar данные рассматриваются часто: сравниваем 7 дней к предыдущим 7 дням и смотрим динамику.
Семантика 18+
Порядка 10 тыс кликов в Google приходилось на “спорные” запросы. Как оптимизировали работу с ключами 18+?
- Убрали все “взрослые” макеты из детской категории
- Убрали рекомендации товаров с принтами 18+ категории для детей
- Во “взрослых” продуктипах не показываются детские товары
Таким образом снизили показы где-то до 1000.
Инструменты SEO-аналитика
Как уже сказано выше, в Google Data Studio составляются 3 типа отчетов. Наряду с этим инструментом Printbar использует Power BI для органического трафика. PBI удобнее GDS, однако первый нуждается в хорошей поддержке и инфраструктуре, т.к. здесь завязаны данные из BigQuery, а это уже требует определенных скиллов от аналитика. Дополнительно проект собирает данные по позициям из Serpstat, базовую текстовую аналитику в Searchlab и вхождения в текстах в Labrika.
Большинство данных получаем из SEOWORK.
Туда загружено порядка 30 тыс запросов, используется сегментация для визуализации данных на BI-отчетах.
Как Printbar использует платформу? Например, нужно узнать, какое количество товаров на листинге эффективнее, потому что они лучше конвертируют как в Яндексе, так и в Google.
Есть и другой пример.
Есть ряд вхождений “с принтом”. Важно понимать, какие спрос и видимость у таких запросов. Знание всей картины позволит делать соответствующие решения, например, добавлять эти фразы в тайтл.
Выбранные софты позволяют собирать отчеты, которые важны для работы отделов SEO, маркетинга и дизайна. Они иллюстрируют интересы пользователей, которые конвертируются в конкретные задачи. Другими словами, дизайнер видит запрос, под который стоит рисовать новый макет.
Кроме того, всегда на виду динамика проекта. Информация о росте или резком падении категорий дают возможность своевременно и без трафиковых потерь реагировать на обстоятельства.
Отделу SEO стало легко работать с новыми/старыми коллекциями в SEO-admin:
- простой импорт и экспорт
- API для фидов
- управление блоками линковки
- шаблонизаторы для всех meta и текстов (для листингов и карточек)
- легко строить сегменты для SEOWORK
Для сайта с количеством страниц более 500 тыс, а тем более в 1+ млн такая детальная аналитика крайне важна, потому что в точках входа скапливается очень много мусора
Казалось бы, что мешает Printbar сгенерировать миллион запросов, создать столько же страниц и удвоить, а то и утроить прибыль? Увы, все не так просто.
Сложности с семантикой
Где искать?
К СЯ eCommerce такого плана относится все что угодно, включая мемы, фразы, знаки зодиака, праздники, города и еще бесконечное множество. Однако параллельно со “всем” существуют и лицензии — нельзя просто так взять и распечатать Человека-паука.
В целом вордстат у ребят из Printbar очень своеобразный. Он будто бы все отображает, но при этом не всегда успевает. Например, сегодня будет релиз трека популярного исполнителя, вечером он станет хитом, и завтра уже все хотят найти трендовые принты. Из-за этого доля трафика проекта составляет 50% листинги и 50% карточки товаров. Отсюда важные условия:
- на многое влияет название карточки
- наличие карточки в индексе необходимо
- существует нерелевантность карточки (в основном в Google)
Вордстат не всегда отражает реальность/актуальность и не понимает интент. Например, запросы про мерч с певцом “shaman одежда” вордстат не учитывает. Благодаря отчету по внутреннему поиску сайта учитываются только релевантные проекту запросы. Заметив реальный спрос, команда создает новый принт и новую карточку товара, которую пользователь может купить.
Как Printbar ищет семантику?
- Внутренний поиск, вебмастера — ключевой инструмент
- Парсинг конкурентов и выдачи
- Сервисы keyso, moab, букварикс, overlead
- Инфо сайты по фильмам, играм
- Сайты с картинками
- Мемы, ситуации и другой креатив
Найденные запросы проверяются в инструментах на предмет массовости желания и при соответствующих показателях запускается в работу.
Как собирать?
У проекта есть своя фишка. Чтобы потом не делить на группы большой массив данных, команда сразу их формирует. Собираются все коллекции через скрейпер, создается элементарная сцепка, например, [по возрасту — 27 лет: 27 лет футболки] или [Rap — 2Pac: 2Pac футболки] и тд — все это парсится, проверяется частотность, и в результате получается семантика готовая к загрузке в SEOWORK и другие инструменты. Такой метод можно использовать в любой тематике (металлопрокат, промышленное оборудование…).
План сбора
- Генержка: берем “природа”, собираем весь словарь, нормализуем в py7.ru/tools/norm/
- Комбинируем с продуктипами, коммерческими и тематическими масками
- Парсим подсказки, wordstat, mutagen, overlead, word-keeper
- Парсим рел.страницы (вдруг уже есть, а топа нет)
- Через рел.страницы парсим еще в moab, keyso
- Парсим инфо сайты любой тематики: кино, музыка, аниме, игры
- Парсим нужные поля типа: автор, режиссер, актер, герой
Метрики
Что учитывается при работе с семантикой:
- Частотность (в том числе за год)
- Вебмастера: показы / клики
- Данные внутри поиска: показы / количество запросов
- Данные по контексту: показы
- Данные ТОП10: наличие сайтов нашей тематики (иногда могут быть выше нас)
- Данные специфических сайтов:
- • количество просмотров аниме/сериалы
- • количество подписчиков в группе ВКонтакте и тп
Поясним про последнее. Например, появляется какая-то малоизвестная музыкальная группа. В вордстате нет репрезентативных данных. Но параллельно с этим в официальном сообществе ВК этой муз. группы порядка 40 тыс подписчиков = пользователям интересно, а у дизайнера появилась задача отрисовать новый принт.
Как хранить?
Хранить 3+ млн фраз в постоянной обработке, а вместе с ними “нулевки” и запрещенки тяжело. В виду того, что нам не нужна классическая кластеризация, а все данные лежат на уровне коллекций, вопрос с хранением стоит остро. Для такого количества информации Printbar работает над созданием собственного сервиса.
Вывод:
- Собирайте отчеты в pbi/gds и смотрите точки входа
- Обогащайте доп. данными по семантике
- Используйте вебмастера, там больше актуальности
- Поиск по сайту - дает очень много инфы
- Парсите сайты ближайших тематик, идеи для кластеров
- Смотрите зарубежные сайты схожей тематики
- Если доступ к статистике маркетплейсов, используйте
- Разбирайте названия карточек и их характеристики
- По возможности храните данные у себя
- Комбинируйте фразы, парсите вглубь
Первый результат
Обновленное семантическое ядро вышло на 21 тыс запросов. Залили его в сеть и вот что получили практически сразу:
- Решили критические тех. проблемы и систематизировали работу с IT в течение 3-х месяцев
- Сформировали стратегию и бэклог задач в течение 2-х месяцев
- К Новому году (2022) вышли на хороший трафик даже с учетом сезона
Поиск точек роста: DATAFORCE
Структура
В Print Bar есть Power BI, но его не хватает для полноценной аналитики. Выбор пал на DATAFORCE, потому что это наш инструмент)
В виду специфики у проекта есть 2 ключевых структуры: листинги и карточки товаров. Есть потребность мониторить отдельно как “худи”, так и в целом категорию “игры”. В DATAFORCE можно увидеть количество и листингов, и карточек, что критично для Print Bar.
Быстрый мониторинг на предмет какие коллекции и на каком продукте покупают, что именно приносит трафик. Или наоборот, что перестало приносить его — тогда аналитики решают, что с этим делать, оставлять или удалять.
Опять же, какой дизайн и на каком продукте покупают/приносит трафик? Для креативного eCommerce такого плана эти данные необходимы, поскольку на них завязана большая работа команды дизайнеров.
Карточки товаров
Стандарт: "спарсили названия товаров → создали теги → растем". Прием хорошо работает, но как этот процесс выглядит в Print Bar? Для роста трафика на сайте принтов большую роль играет нейминг карточек. Они уже имеют какое-то название, но часто возникает проблема дубликатов. Например, на 1 листинге может быть 40 карточек с одинаковым названием, что плодит неуникальность и прочие проблемы. Такие задачи Printbar решает, используя ренейминг в SEO-админ и впоследствии мониторит динамику трафика в DATAFORCE.
Performance
Отделам контекста, SMM, email тоже важно мониторить, что продается хорошо, куда идет трафик, а где он пропал, что конвертируется лучше и тд. Быстрая реакция на изменения не даст бизнесу потерять прибыль.
Практика
Старые карточки
В Google Data Studio нашли старые карточки товаров, которые тянутся из очень старой структуры сайта, но при этом приносили хороший трафик в Google. Однако на тот момент не удалось понять, сколько именно, потому что не удалось построить маску. Команда приняла решение сделать 301 редирект. Какая-то часть переехала в новую структуру, но в основном потеряли около 4,5 тыс трафика.
Дополненное представление в поиске Яндекс
- Подключили API yml
- На старте было где-то 1400 фидов, что равняется 53 млн офферов. Офферов действительно было много, но можно их тегать с помощью utm — удобно для внутренней аналитики. Был хороший прирост трафика
- Со временем решили урезать количество фидов и сейчас около 250 = ~6,6 млн офферов — трафик постепенно начинает расти
- Доля посетителей, совершивших заказ = ~3%
Дополнение от Яндекса интересное, есть свои особенности. Например, если у Printbar не будет карточки или листинга в индексе, но при этом человек сделает запрос с принтом и попадет в нужное название, то покажется ваш проект. Это позволяет всегда получать какую-то долю трафика.