Как настроить контроль бизнес-метрик и сэкономить 400 тысяч рублей в месяц: кейс Yandex Crowd
Каждые сутки команда клиентского сервиса Yandex Crowd получает порядка 80 тысяч обращений. Чтобы отвечать как можно быстрее и качественнее, компания внедрила инфраструктурный мониторинг.
Yandex Crowd — инфраструктурный сервис Яндекса, который помогает командам компании ускорять продуктовые запуски, масштабировать процессы, повышать качество продуктов и оптимизировать затраты.
Почему нам потребовалось ускорить аналитику
В нашу поддержку поступает примерно один запрос в секунду: через колл-центр, почту, соцсети, чаты и сторы. Мы помогаем многим сервисам Яндекса, например, Музыке, Маркету, Кинопоиску, Путешествиям и другим. Обычно на ответ даётся три часа, но некоторые обращения нужно решить за несколько минут или секунд. Например, если пользователь Путешествий приехал в отель, а администратор не видит бронирование.
Чтобы стабильно быстро отвечать на запросы, нужно видеть ключевые метрики: скорость ответов, количество операторов на линии, нагрузку на каждого из них, а также на группу и направление в целом.
Раньше мы получали такие данные через пинговалки — внутренний инструмент, который раз в час сообщал о количестве необработанных обращений и нагрузке на операторов.
С нашими объёмами это слишком медленно — часть информации устаревала. Это особенно критично при сбоях, когда нагрузка на саппорт возрастает в несколько раз и команде необходимо получать статусы в реальном времени.
Мы поняли, что нам нужен другой инструмент.
Какие варианты рассмотрели и на чём остановились
Были решения, которые не подошли нам по деньгам, срокам внедрения или набору функций:
- Доработать систему пинговалок. Это наше самописное решение, которое не справлялось с сегодняшним объёмом информации и SLA по скорости ответа. Мы могли его доработать, но это было бы долго и дорого: архитектура позволяла вносить изменения только через разработку. Проще было создать систему с нуля.
- Перенять опыт коллег. Популярное решение на рынке — Grafana, система визуализации данных, ориентированная на IT-мониторинг. В ходе теста мы обнаружили, что без лицензии нельзя настроить доступы. Исходные данные открывались всем сотрудникам — это не подходит по нашей политике безопасности. А лицензия обошлась бы в 40 тысяч евро.
- Внедрить Yandex DataLens. Этот сервис Yandex Сloud позволяет анализировать и визуализировать дан��ые, но пока не умеет отправлять алерты по событиям. Такие оповещения нам нужны, чтобы быстро оценить ситуацию и принять решение. Например, алерт о событии «линия факта расходится с линией плана на X%».
В итоге решили попробовать Yandex Monitoring — инструмент для мониторинга технического состояния систем и продуктов. Он позволяет собирать метрики и настраивать алерты.
Для нас это удобный сервис, потому что он легко интегрируется с другими системами Яндекса, которыми мы пользуемся. В нём можно разграничивать права доступа, например для технических специалистов и для бизнеса, и настраивать уведомления по любым каналам: электронная почта, СМС, Telegram, а также через звонки на телефон. Ещё можно добавить срабатывание функции в Yandex Cloud Functions по определённому событию. Например, вызвать функцию, которая отправляет сообщение в корпоративный мессенджер.
Как работает Yandex Monitoring в клиентском сервисе
Мы используем инструмент для алертинга и информирования.
Алерты — это уведомления, которые срабатывают при заданных условиях. Например, поступило обращение, для обработки которого нужны специфические компетенции. Уведомление об этом появляется в чате поддержки, и команда может поменять очерёдность обработки обращений, если это необходимо.
Алерты помогают вовремя отвечать на обращения. Когда два из стандартных трёх часов на ответ истекают, в чате операторов появляется предупреждение. Это позволяет выстроить приоритет обработки обращений, чтобы уложиться в SLA.
Информирование используется для контроля текущей ситуации в разных направлениях поддержки. Когда всё идёт штатно, система присылает сообщение о том, сколько обращений находятся в очереди и за какое время их нужно рассмотреть.
Информирование отдельных команд настроено через Яндекс Мессенджер. А если статус нужен сотрудникам всех направлений клиентского сервиса, можно получать его в самом сервисе Yandex Monitoring.
Ещё с помощью информирования мы контролируем процессы, которые размечают и маршрутизируют обращения, чтобы они попадали на обработку в нужное направление к нужному специалисту. В сложных случаях идём за помощью к разработчикам.
Стандартный алертинг и информирование мы настраиваем своими силами, без привлечения разработки. Сотрудники саппорта могут подключать и отключать нужные мониторинги через внутреннюю систему.
По ходу внедрения пишем техническую документацию, по которой потом будем работать. Это обеспечивает лёгкий вход как в администрирование проекта (настройку мониторингов), так и в разработку.
Какие результаты получили
У нас появился инструмент управления командой поддержки в онлайн-режиме — а это 5 тысяч операторов. Данные помогают быстрее принимать решения и отвечать пользователям в обещанный срок.
Также мы сократили использование вычислительных ресурсов: оптимизация кода и новые инструменты позволяют использовать на 30% меньше железа по сравнению с пинговалками. За счёт этого мы теперь экономим 400 тысяч рублей в месяц.
Подводя итог:
- Yandex Monitoring можно использовать в бизнесе любого размера. Среднему и крупному он полезен, так как позволяет обрабатывать большие объёмы информации, упорядочивать данные и следить за всеми системами. Малому бизнесу сервис заменит аналитика, если на него нет бюджета: CEO стартапа может сам отслеживать показатели по множеству параметров и улучшать продукт.
- Обычно мониторинг используется для контроля технических процессов, но его можно применять и для бизнес-показателей. Например, настраивать уведомления, если клиент зависает на каком-то этапе воронки или если очередь обращений в поддержку превышает допустимый размер.
- Для работы Yandex Monitoring важно качество входящих данных: их нужно правильно собирать, хранить и обрабатывать. Данные передаются в систему в реальном времени — это тоже нужно уметь делать без потери качества.
- Сроки внедрения зависят от размера бизнеса и задачи. В Yandex Crowd каждая метрика внедряется в среднем за два месяца. Работа делится на такие этапы: поставка данных, настройка метрик для мониторинга, бизнес-тестирование на узкой группе, выпуск в прод.
- При внедрении важно вести документацию: описать планируемую архитектуру и ход разработки, сформировать план внедрения метрик, составить техническую документацию для каждого этапа проекта.
- Не бойтесь пробовать нестандартные решения, которые могут улучшить процессы. Отслеживание бизнес-показателей Yandex Crowd через Yandex Monitoring — как раз такое решение.
Подписывайтесь на наш телеграм-канал и читайте ещё больше историй о компаниях, которые создают и развивают бизнес вместе с Yandex Cloud.
Другие кейсы наших клиентов и партнёров: