Как мечты о космосе привели в МегаФон

Никита Козырев, недавний стажер акселератора big data МегаФона, рассказывает, как устроиться работать в крупную компанию, будучи студентом, что общего у машинного обучения и аэродинамики и куда приводят детские мечты.

Как мечты о космосе привели в МегаФон

За что меня взяли в МегаФон

Меня зовут Никита. Учусь на четвертом курсе Бауманки, а с шестого апреля тружусь в МегаФоне аналитиком и занимаюсь большими данными. Я получил эту работу, потому что целенаправленно к ней шел: учился, искал возможности и, главное, стажировался.

После окончания третьего курса я задумался о своей карьере и понял, что мне необходим опыт. Активно искал работу-стажировку, рассылал резюме по компаниям, принимал участие в отборах.

Я проходил курсы от МФТИ, когда один из студентов — Роман Васильев — рассказал мне о наборе на стажировку в МегаФон. Я решил написать рекрутеру Светлане Стакановой, прошел отбор и поступил в акселератор.

Как я дошел до машинного обучения

Как и многие дети, я мечтал строить ракеты и полететь в космос. Но, к сожалению, однажды понял, что космонавтом не стану: здоровье не то. Поступил в Бауманку и учился в космической сфере, проходил практику на военно-промышленном предприятии. Благодаря Бауманке я осознал, чем хочу заниматься на самом деле. Оказалось, что мне больше нравятся задачи, приближенные к реальной жизни, а не мечты об освоении далеких звезд.

В университете я учусь решать прикладные задачи в области вычислительной математики, механики и математической физики: проводить аэродинамические расчеты, моделировать новые материалы, композиционные материалы и наноструктуры, пишу диплом по теме «Восстановление параметров обтекания в возмущенной области и геометрии ударной волны около затупленного тела».

Я в акселераторе — мне повезло​
Я в акселераторе — мне повезло​

В работе я занимаюсь машинным обучением, и, хотя моя вузовская специальность кажется далекой от этой сферы, сходство все-таки есть, особенно в том, что касается математики.

Только не надо думать, что я отказался от детской мечты о ракетах. Просто моя работа — это реализация планов повзрослевшего человека.

Как я попал на стажировку

Когда я искал, где бы прокачать рабочие навыки, целенаправленно шел именно в машинное обучение. Формально с ML познакомился в институте: у нас был курс статистики и методов оптимизации, там я узнал, что можно делать при помощи машинного обучения, и понял, что мне это интересно.

Дальше был период самостоятельного освоения материала: читал статьи на «Хабре», брал курсы на Coursera (один из них по Python — основному языку для ML), реализовывал с нуля библиотеки, писал сайты.

Рабочий момент в акселераторе​
Рабочий момент в акселераторе​

Подготовка и поиск помогли наткнуться на акселератор МегаФона. Меня привлекли условия. На старте обещали обучение, возможное трудоустройство по итогам стажировки и зарплату. Это было круто, потому что любой труд должен быть оплачен, даже если ты еще студент и только проходишь «боевую подготовку».

А дальше я прошел два собеседования. Первое — теоретическое, тест по машинному обучению. Второе — практика: мне выдали метрики и набор обезличенных данных, необходимо было решить бизнес-задачу по классификации за три часа. Оказалось нетрудно, потому что у меня свежи основные знания, которые нужны для заданий отборочного тура. И вот я оказался в акселераторе.

Что происходило на стажировке

Акселератор — мой первый опыт стажировки в так называемой «песочнице». Нам с ходу дали серьезные боевые задачи из реальной практики аналитиков, правда не срочные — для таких решений надо было хорошо знать инфраструктуру МегаФона. Я сначала почти ничего не понимал и боялся, но хотел скорее начать карьерный путь.

В акселераторе три месяца стажировались пятеро студентов, с нами занимался ментор Артем Селезнев. Он вел курс молодого бойца: технический ликбез по Hadoop, Spark, SQL, Pipeline и процессам. Он же давал нам домашние задания по Hadoop и Spark.

Артем Селезнев​
Артем Селезнев​

Еще мы сразу же попали в руки к аналитикам. В первые две недели изучали базу данных и соображали, что можно из них получить. Также мы осваивали весь стек, который используют в big data МегаФона: Oracle Exadata (SQL, PL/SQL), Cloudera Hadoop, Hive, Spark, Pyspark, Python (sklearn, xgboost, pandas, etc), Linux bash. Система контроля версий: git.

Занятия проходили в виде встреч два раза в неделю, каждая встреча занимала два часа.

И тут мне пригодилась вся высшая математика. В работе я строю модели для предсказания, в их основе лежит матанализ, матстатистика, методы оптимизации, линейная алгебра, аналитическая геометрия. Пишу много кода, поэтому нужна база по информатике, знание Python и SQL.

В дополнение к основным задачам каждую неделю мы выбирали капитана нашей скромной команды, который делал доклад по теме, не связанной с построением моделей, — например, RFM-анализ, AB-тесты и их применение.

«Униформа» акселератора​
«Униформа» акселератора​

Атмосфера была ламповая. Занимались в небольшой переговорке в головном офисе на Оружейном переулке. Ребята-аналитики часто к нам заглядывали, помогали с решениями и рассказывали про свои команды.

Мы работали по kanban-системе. Самостоятельно решали задачи, клеили их на kanban-доску, а вопросы — в зону паркинга. Наши руководители или куратор отвечали на них, когда заходили в аудиторию. Руководители — тимлиды направления аналитики больших данных — общались с нами на равных и давали задачи, которые по силам только профессионалам.

Наша ​kanban-доска
Наша ​kanban-доска

Именно на стажировке я сделал три проекта, связанных с машинным обучением, которые помогли мне пройти собеседование.

Первый проект — сегментирование абонентской базы для предложения платных продуктов МегаФона по возрастной группе

Необходимо было построить таргет — целевое событие, которое мы собираемся предсказывать. Сначала я не знал, как приступить к этой задаче. В моем распоряжении была обезличенная база клиентов с описывающими их признаками. На их основе я обучил модель и выявил паттерн поведения клиента, для которого предложение будет наиболее актуальным. Это активный пользователь МегаФона: звонки, интернет, сервисы (например, «МегаФон ТВ», «МегаФон Специи»).

Второй проект — кешбэк в сервисе «МегаФон Путешествия»

Здесь я познакомился с пайплайном построения решения задач в МегаФоне и механизмом автоматизации.

Задача состояла в построении новой модели для определения потенциальных пользователей сервиса «МегаФон Путешествия». Формализована как задача классификации: 1 – пользователь зарегистрируется в сервисе, 0 – не зарегистрируется в течение определенного периода, например, недели. Благодаря некоторой количественной оценке и когортному анализу выбрали подход look-alike, обучили алгоритм классификации и получили довольно неплохие по метрике ROC-AUC и Lift результаты. Модель отправили на тестирование.

Третий проект — «Тряси смартфон», инбаунд

Пользователи МегаФона в личном кабинете раз в неделю трясут смартфоны, и им выпадает индивидуальное предложение: скидка на тарифный план, различные предложения у партнеров, вознаграждение за пополнение баланса на определенную сумму — это могут быть бонусные рубли на счет мобильного телефона, дополнительный пакет минут или гигабайтов интернета. Моей задачей было изучение и изменение индивидуальных предложений. Я реализовал механику подбора, основываясь на различных статистиках, например, уровне интереса. Написал код, который впоследствии был внедрен в работу сервиса. Я и раньше был знаком с этой функцией МегаФона, но редко ей пользовался. Интересно было узнать, как все работает изнутри.

Я справился со всеми задачами и прошел собеседование с Виталием Щербаковым, директором по аналитике больших данных. Теперь буду работать в МегаФоне, чему очень рад.

Виталий Щербаков​
Виталий Щербаков​

Придется совмещать дела с учебой, но в этом семестре мы в основном занимаемся дипломом. Все равно предстоит напрячься. Я хочу перенести полезные привычки с работы в повседневную жизнь: в МегаФоне мы ведем задачи в Jira, в телефоне давно установлены органайзеры. Мне нравится техника Pomodoro: работаю 25 минут, потом короткий перерыв на 3–5 минут, а после каждой четвертой 25-минтуки отдых 15–20 минут. Это позволяет самому определять адекватные сроки выполнения задач.

Все в сборе​
Все в сборе​

На стажировке я понял, что в работе аналитика хоть и мало космического, зато много творческого. А еще сегодня нельзя аналитиков разделять на две категории — один думает, другой программирует. Каждому аналитику нужно уметь кодить, пусть только для автоматизации процессов и написания скриптов.

Набор в акселератор продолжается. Чтобы узнать подробнее, смотрите вакансию на карьерном сайте МегаФона и пишите рекрутеру Светлане Стакановой на почту svetlana.stakanova@MegaFon.ru

88
20 комментариев

Мегафон молодцы что постарались, но текст, который якобы от стажера, но с насыщением странными фразами и заманухами- вызывает странные ощущения. Условия стажировки можно и от лица компании в конце подытожить - было бы более органично, а не как  якобы комментарии от первого лица вставлять.

15
Ответить

Какой Оружейный проспект? Переулок!

4
Ответить

копирайтер который это писал наверное и москвы не видел :)

4
Ответить

Первый проект — сегментирование абонентской базы для предложения платных продуктов МегаФона по возрастной группе

Ага, выявление пенсионеров и тихое подключение их на платные подписки.

5
Ответить

Можно подумать, Мегафон не в курсе возраста своих абонентов

Ответить

Проект "охота на пенса"🤣🤣🤣

Ответить

Мне кажется или делать ракеты куда интереснее чем мл?

4
Ответить