Анализ потребительских предпочтений с помощью SHAP-модели на рынке HoReCa
Один из Клиентов агентства Paper Planes - сеть ресторанов в Москве, обратился к нам за разработкой стратегии и позиционирования своих заведений.
В рамках поиска формата мы решили проанализировать клиентские предпочтения аудитории, выявить то, какие факторы влияют на оценки пользователей после посещения кафе/ресторана.
Мы обратились к открытым источникам, главным критерием выбора которых стало наличие подробной информации о заведениях Москвы: формат, разновидность кухни, отзывы, стоимость и рейтинг от посетителей. TripAdvisor прекрасно подошел для выполнения данной задачи.
Проблемы подобного решения:
- Отсутствие возможности выгрузки статистики;
- Данная статистика не отражает зависимость между критериями заведения и оценками пользователей.
Как мы это преодолели:
- Разработка парсера, который позволил в оперативном режиме выгрузить все необходимые данные по 9 245 заведениям Москвы;
- По итогам выгрузки мы построили интерактивный дашборд с общей статистикой.
Для верной интерпретации графиков развернули SHAP-модель, что позволило выявить корреляцию между характеристиками заведения и оценками пользователей.
Как характеристики заведения влияют на оценку клиента?
Немного о подходе
SHAP расшифровывается как SHapley Additive explanation. Этот метод помогает разбить на части прогноз, чтобы выявить значение каждого признака. Он основан на Векторе Шепли, принципе, используемом в теории игр для определения, насколько каждый игрок при совместной игре способствует ее успешному исходу.
SHAP можно использовать для разных целей, при анализе параметров ресторана, как в нашем случае, или, например, в HR-аналитике, чтобы сформировать портрет сотрудника, который с наибольшей вероятностью покинет рабочее место. Везде, где необходимо кластеризовать большие данные и найти взаимосвязи между группами параметров.
Что мы получили
Полученный график интерпретируется следующим образом:
По Y оси - сила влияния конкретного фактора на рейтинг: чем выше находится строчка (в красной зоне), тем сильнее она влияет на оценку посетителей.
Точки внутри - это конкретные рестораны, которые подпадают под данный критерий.
Чем больше красных точек сбивается вправо, тем позитивнее сказывается параметр на оценке заведения и наоборот.
По итогам анализа мы выделили критерии, положительно влияющие на рейтинг ресторана:
• Гастропабы;
• Итальянская кухня;
• Современная;
• Здоровое питание;
• Барбекю
• Восточно-европейская кухня
Именно такие заведения в среднем гораздо чаще получают высокую оценку. А заведения японской кухни, фастфуд или кафе Клиенты оценивают более активно, но уже в негативном ключе.
В итоге с помощью моделирования и анализа клиентского опыта мы решили выстроить позиционирование Клиента в тематике восточно-европейской кухни.
Таким образом, используя только открытые источники данных и собственные наработки, мы смогли сформировать позиционирование и стратегию для нашего Клиента, а также провести анализ потребительских предпочтений и выявить актуальные тренды в сфере HoReCa.