Как настроить контроль бизнес-метрик и сэкономить 400 тысяч рублей в месяц: кейс Yandex Crowd

Каждые сутки команда клиентского сервиса Yandex Crowd получает порядка 80 тысяч обращений. Чтобы отвечать как можно быстрее и качественнее, компания внедрила инфраструктурный мониторинг.

Yandex Crowd — инфраструктурный сервис Яндекса, который помогает командам компании ускорять продуктовые запуски, масштабировать процессы, повышать качество продуктов и оптимизировать затраты.

В нашу поддержку поступает примерно один запрос в секунду: через колл-центр, почту, соцсети, чаты и сторы. Мы помогаем многим сервисам Яндекса, например, Музыке, Маркету, Кинопоиску, Путешествиям и другим. Обычно на ответ даётся три часа, но некоторые обращения нужно решить за несколько минут или секунд. Например, если пользователь Путешествий приехал в отель, а администратор не видит бронирование.

Чтобы стабильно быстро отвечать на запросы, нужно видеть ключевые метрики: скорость ответов, количество операторов на линии, нагрузку на каждого из них, а также на группу и направление в целом.

Раньше мы получали такие данные через пинговалки — внутренний инструмент, который раз в час сообщал о количестве необработанных обращений и нагрузке на операторов.

С нашими объёмами это слишком медленно — часть информации устаревала. Это особенно критично при сбоях, когда нагрузка на саппорт возрастает в несколько раз и команде необходимо получать статусы в реальном времени.

Мы поняли, что нам нужен другой инструмент.

Были решения, которые не подошли нам по деньгам, срокам внедрения или набору функций:

Доработать систему пинговалок. Это наше самописное решение, которое не справлялось с сегодняшним объёмом информации и SLA по скорости ответа. Мы могли его доработать, но это было бы долго и дорого: архитектура позволяла вносить изменения только через разработку. Проще было создать систему с нуля.
Перенять опыт коллег. Популярное решение на рынке — Grafana, система визуализации данных, ориентированная на IT-мониторинг. В ходе теста мы обнаружили, что без лицензии нельзя настроить доступы. Исходные данные открывались всем сотрудникам — это не подходит по нашей политике безопасности. А лицензия обошлась бы в 40 тысяч евро.
Внедрить Yandex DataLens. Этот сервис Yandex Сloud позволяет анализировать и визуализировать дан��ые, но пока не умеет отправлять алерты по событиям. Такие оповещения нам нужны, чтобы быстро оценить ситуацию и принять решение. Например, алерт о событии «линия факта расходится с линией плана на X%».

В итоге решили попробовать Yandex Monitoring — инструмент для мониторинга технического состояния систем и продуктов. Он позволяет собирать метрики и настраивать алерты.

Для нас это удобный сервис, потому что он легко интегрируется с другими системами Яндекса, которыми мы пользуемся. В нём можно разграничивать права доступа, например для технических специалистов и для бизнеса, и настраивать уведомления по любым каналам: электронная почта, СМС, Telegram, а также через звонки на телефон. Ещё можно добавить срабатывание функции в Yandex Cloud Functions по определённому событию. Например, вызвать функцию, которая отправляет сообщение в корпоративный мессенджер.

Мы используем инструмент для алертинга и информирования.

Алерты — это уведомления, которые срабатывают при заданных условиях. Например, поступило обращение, для обработки которого нужны специфические компетенции. Уведомление об этом появляется в чате поддержки, и команда может поменять очерёдность обработки обращений, если это необходимо.

<i>Алерт для команды поддержки Яндекс Командировок</i>

Алерты помогают вовремя отвечать на обращения. Когда два из стандартных трёх часов на ответ истекают, в чате операторов появляется предупреждение. Это позволяет выстроить приоритет обработки обращений, чтобы уложиться в SLA.

<i>Алерт о сроках ответа. Сансара — это омниканальная коммуникационная платформа Yandex Crowd для клиентского сервиса, продаж и не только. </i>

Информирование используется для контроля текущей ситуации в разных направлениях поддержки. Когда всё идёт штатно, система присылает сообщение о том, сколько обращений находятся в очереди и за какое время их нужно рассмотреть.

Информирование отдельных команд настроено через Яндекс Мессенджер. А если статус нужен сотрудникам всех направлений клиентского сервиса, можно получать его в самом сервисе Yandex Monitoring.

<i>Мониторинг системы AppFlow, через которую мы обрабатываем ответы в магазинах приложений </i>

Ещё с помощью информирования мы контролируем процессы, которые размечают и маршрутизируют обращения, чтобы они попадали на обработку в нужное направление к нужному специалисту. В сложных случаях идём за помощью к разработчикам.

<i>Мониторинг внутренних автоматизаций, которые отвечают за распределение задач </i>

Стандартный алертинг и информирование мы настраиваем своими силами, без привлечения разработки. Сотрудники саппорта могут подключать и отключать нужные мониторинги через внутреннюю систему.

По ходу внедрения пишем техническую документацию, по которой потом будем работать. Это обеспечивает лёгкий вход как в администрирование проекта (настройку мониторингов), так и в разработку.

У нас появился инструмент управления командой поддержки в онлайн-режиме — а это 5 тысяч операторов. Данные помогают быстрее принимать решения и отвечать пользователям в обещанный срок.

Также мы сократили использование вычислительных ресурсов: оптимизация кода и новые инструменты позволяют использовать на 30% меньше железа по сравнению с пинговалками. За счёт этого мы теперь экономим 400 тысяч рублей в месяц.

Подводя итог:

Yandex Monitoring можно использовать в бизнесе любого размера. Среднему и крупному он полезен, так как позволяет обрабатывать большие объёмы информации, упорядочивать данные и следить за всеми системами. Малому бизнесу сервис заменит аналитика, если на него нет бюджета: CEO стартапа может сам отслеживать показатели по множеству параметров и улучшать продукт.
Обычно мониторинг используется для контроля технических процессов, но его можно применять и для бизнес-показателей. Например, настраивать уведомления, если клиент зависает на каком-то этапе воронки или если очередь обращений в поддержку превышает допустимый размер.
Для работы Yandex Monitoring важно качество входящих данных: их нужно правильно собирать, хранить и обрабатывать. Данные передаются в систему в реальном времени — это тоже нужно уметь делать без потери качества.
Сроки внедрения зависят от размера бизнеса и задачи. В Yandex Crowd каждая метрика внедряется в среднем за два месяца. Работа делится на такие этапы: поставка данных, настройка метрик для мониторинга, бизнес-тестирование на узкой группе, выпуск в прод.
При внедрении важно вести документацию: описать планируемую архитектуру и ход разработки, сформировать план внедрения метрик, составить техническую документацию для каждого этапа проекта.
Не бойтесь пробовать нестандартные решения, которые могут улучшить процессы. Отслеживание бизнес-показателей Yandex Crowd через Yandex Monitoring — как раз такое решение.

Подписывайтесь на наш телеграм-канал и читайте ещё больше историй о компаниях, которые создают и развивают бизнес вместе с Yandex Cloud.

Другие кейсы наших клиентов и партнёров:

Как настроить контроль бизнес-метрик и сэкономить 400 тысяч рублей в месяц: кейс Yandex Crowd

Почему нам потребовалось ускорить аналитику

Какие варианты рассмотрели и на чём остановились

Как работает Yandex Monitoring в клиентском сервисе

Какие результаты получили