Чем занимаются и как работают в центре управления сетью «МегаФона»
Материал подготовлен при поддержке компании «МегаФон»
Павел Белесов, директор по эксплуатации сети «МегаФона»
Что происходит в ЕЦУС — месте, где управляют сетью
В 2015 году «МегаФон» открыл две площадки Единого центра управления сетью. Ведущая площадка Центра находится в Петербурге, на Васильевском острове. Она и самарская площадки — две части единого целого, они выполняют одну и ту же работу, но каждая курирует свою территорию в масштабах страны. В критической ситуации, когда одна из площадок не может полноценно функционировать, вторая может перехватить управление.
за 15 минут
В штате обеих площадок работают несколько сотен специалистов — инженеры, аналитики, эксперты по технологиям связи. Команда следит за состоянием инфраструктуры и сервисами компании, занимается оперативным управлением и устранением проблем.
Рабочие места в опенспейсе обращены к видеостене, составленной из нескольких десятков экранов.
Видеостена в режиме реального времени выводит статистику о доступности инфраструктуры в регионах страны, данные об успешности установления вызовов, передаче пакетных данных, предоставления ИТ-услуг и другую информацию.
В другой части экрана — информация о доступности сервисов во всех регионах. Рядом схема транспортной сети, на которой зелёным цветом подсвечиваются действующие маршруты, а оранжевым — нерабочие. Транспортная сеть выстроена кольцами, чтобы при аварии пустить трафик в обход.
По каждому региону можно посмотреть статистику потребления сервисов. Как правило, графики имеют характерные изгибы: равномерны днём и начинают снижение с наступлением ночи. Также выводится информация о работе базовых станций — их у «МегаФона» почти 228 тысяч.
Специалисты следят и за плановыми работами: смотрят, чтобы они не пересекались и не создавали сложных ситуаций в одном сегменте сети. На отдельных экранах выводятся данные о состоянии центров обработки данных — например, о температурном режиме.
Чем занимаются сотрудники Центра
В зале работают два подразделения первой линии. Они просматривают обращения клиентов и отклики от оборудования. Их задача — контролировать разные сети: транспортные, коммутационные, сети доступа. Ещё они работают по международной и междугородней связи, ИТ- и дополнительным услугам, которые, например, абонент подключает сам.
Сотрудники первой линии на посту круглосуточно: они первыми узнают о возможных проблемах и приступают к их разрешению. Сложные специализированные задачи берёт на себя вторая линия — команды профильных подразделений, которые занимаются управлением сетью. Когда не получается определить природу проблемы, в дело вступают эксперты по техническому анализу.
В Центре разработали свои приёмы по повышению эффективности: к примеру, рядом с командой первой линии так же всегда есть специалисты второй — по необходимости они быстро подключаются к решению любой проблемы.
Центр работает круглосуточно и без выходных. Всё оборудовано для комфорта сотрудников: большие мониторы, удобные кресла, звукопоглощающие элементы. Экраны на стене сделаны по проекционной технологии — они не греются, так что и охлаждать их (и создавать лишний шум) не нужно.
Наш и международный опыт: зачем операторам ЕЦУС
Раньше центры управления сетью были в каждом из восьми филиалов компании. В 2014 году «МегаФон» принял решение сконцентрировать ресурсы: человеческие, финансовые и информационные. Так появилась федеральная структура ЕЦУС — она поможет повысить качество контроля и ускорить внедрение новых сервисов.
При запуске единого центра команда взяла лучшие практики из всех подразделений по стране. Изучали и международный опыт, в том числе центр управления сетью оператора Vodafone. Отчасти «МегаФон» пошёл своим путём.
При разработке концепции мы анализировали мировой опыт. Чаще всего мы видели примеры центров, в которых обеспечивалось наблюдение за сетью, обнаружение аварий и координация их устранения. Тогда как конфигурирование сети, в том числе для её технического развития, выполнялось другими структурными подразделениями.
Наша концепция включила не только мониторинг, но и выполнение всего цикла технических работ: от создания новых элементов и тестирования до работы с обращениями клиентов.
Сегодня ЕЦУС отвечает и за работу с инцидентами, и за воплощение любых технических решений. Через несколько лет после начала проекта нашим путём пошли многие компании в отрасли — операторы и мировые сервисные компании строят комплексные, многофункциональные технологические центры управления сетью. Наш выбор был верным.
Автоматизировать всё
В основе работы ЕЦУС «МегаФона» — ИТ-платформа, которая автоматизирует большую часть рутинной работы, обрабатывает и структурирует данные.
Всего в сети более 450 тысяч активных элементов, которые генерируют до 17 млн обращений. Эти обращения автоматически фильтруются и очищаются от повторов — остаётся около пяти тысяч инцидентов, которым нужна проверка.
Платформа обогащает информацию о каждом инциденте: что вышло из строя, как оно сконфигурировано, в каком состоянии сейчас и с кем нужно выйти на связь — делает всё, чтобы команда разобралась как можно скорее.
Ежедневно в сети проходит более 800 работ, связанных с изменением конфигурации, управлением сервисами, вводом нового оборудования — всё это нужно отслеживать и сопоставлять с информацией о текущих событиях.
Для событий, которым требуется отдельное внимание, система формирует дополнительные дашборды с ещё более подробными данными — в режиме реального времени.
Мощностями ЕЦУС может пользоваться не только сам оператор, но и другие компании, у которых есть собственные сети. Чтобы не строить собственный центр, они отдают мониторинг на аутсорс. В «МегаФоне» есть отдельная команда, которая следит за работоспособностью сторонних сетей — это предложение называется «ЕЦУС как услуга».
Мы руководствуемся сервис-центричным подходом к управлению сетью. Это более высокий уровень контроля, нежели контроль состояния оборудования.
Добиться этого без автоматизации и единой платформы управления клиентским опытом и качеством услуг было бы невозможно. Для повышения качества предоставляемых сервисов также важен проактивный мониторинг: устранив причины возможных сбоев и аварий еще до их возникновения, мы добиваемся высокого качества услуг.
Этот подход уже проверен практикой, так что сейчас мы переходим от управления сетью к управлению сервисами. Это наше ближайшее настоящее.