Data Science: карьерный обзор 2019 года
Новое микроисследование ИТ-специализированного кадрового агентства Spice IT Recruitment. На этот раз — о текущей ситуации на рынке труда гуру машинного обучения и больших данных.
Ведущий консультант Spice IT Алина Чистякова пообщалась со специалистами по машинному обучению топовых технологических компаний, а Юлия Попова в очередной раз оформила результаты интервью в яркие иллюстрации.
Как всегда, в конце материала будет бонус для дочитавших. На этот раз это выпуск подкаста, который мы записали вместе с Валерой Бабушкиным и Женей Рябенко, про то, как быть (и как стать!) Data Scientist.
Валера входит в сотню лучших специалистов по большим данным в мире, работает директором по моделированию и анализу данных в X5 Retail Group, руководит группой аналитики в Яндексе, а также преподает в ВШЭ введение в Data Science.
Женя с недавних пор живет в Лондоне, он Research Scientist в команде Core Data Science в Facebook.
Мы поговорили с ребятами про особенности построения карьеры, профессиональное самоопределение и самообразование… в общем, затронули все самые актуальные темы, как для начинающих, так и для «продолжающих» специалистов.
Вообще профессию Data Scientist сегодня часто называют одной из самых "сексуальных" — перспективных и модных. Однако путь к этой профессии нелегок: невозможно овладеть всеми компетенциями и инструментами за месяц или даже год.
Для входа в профессию необходимы хорошая математическая база (статистика, математика, линейная алгебра), знание алгоритмов и навыки программирования.
Middle-cпециалисты обычно уже разбираются в особенностях архитектуры, могут адаптировать модели под конкретную задачу, а также доступно визуализировать данные.
Специалисты уровня senior могут быстро обучать прототипы и выбирать модели под задачу, понимают потребности бизнеса и хорошо разбираются в распределенных вычислениях.
Лиды чаще всего выступают связующим звеном между бизнесом и командой. В их работе большую роль играют soft skills. От себя добавим, что поиск работы на вакансию такого грейда состоит из наибольшего количества этапов собеседований, и включает в себя как технические интервью, так и скрупулезную оценку soft skills.
Что касается специалистов уровня middle + и выше, обычно у них бывает 2 и более технических этапов интервью. Они включают в себя проверку знания базовых алгоритмов, умение находить нестандартные решения, знания ML.
Нужно быть готовым к тому, что интервью в крупных компаниях может длиться от 4-5 часов и дольше.
Как Data Scientist может повысить свою конкурентоспособность, и, как следствие, заработную плату? Наши респонденты посоветовали обратить внимание вот на какие аспекты.
На зарплату влияет способность "делать" результат, умение генерировать новые идеи, умение быть убедительным, огонь в глазах. Ну и разумеется, хорошее знание мат. части и предыдущий опыт.
Я бы отметил наличие и/или количество публикаций, опыт в индустрии, умение руководить, общий уровень интеллекта, математический бэкграунд, участие в конкурсах на Kaggle.
Я не понимаю, что вообще способен сделать DS без знания английского. И нужен английский не только для того, чтобы разбираться во всех быстро меняющихся трендах и методах, но и для банального чтения документаций и форумов по используемым библиотекам.
В первую очередь ценится практический опыт. Важно не то, какие курсы вы прошли на Coursera, а какие технологии применяли на практике, какие были трудности, как вы с ними справились, на сколько и какие вырастили метрики.
Резюмируя вышесказанное, собирательный образ некого идеального специалиста выглядит следующим образом.
В качестве бонуса (для тех, кто дочитал) делимся выпуском подкаста, в котором мы — я и Дима Чебанов вместе с гостями пытаемся разобраться во всех тонкостях построения карьеры в Data Science.
Мы обсуждаем над какими навыками нужно работать, чтобы попасть в индустрию, в каком направлении развиваться дальше, что спрашивают на собеседованиях в Google и Facebook... Даже шутим там пару раз!
Слушайте нас, где удобно: мы есть в Apple Подкастах, Google Подкастах, на Яндекс Музыке и в Spotify. Ставьте нам оценки, оставляйте комментарии. Обратная связь очень важна для нас. Именно она мотивирует продолжать.
Благодарю за статью! Я совсем недавно узнал о данной специальности и статья очень проста и понятна. Круто!
Всегда пожалуйста! рады, что материал оказался полезным.
Можно еще дать совет студентам, мечтающим о работе Data Scientist-ом: не забивайте на пары. Скоринг в крупные компании с низким средним баллом можно не пройти.
Можно ложечку дегтя в сладкую патоку вашей сексуальности в теме дата-научности:
1. Данные в отрыве от понимания как эти данные генерятся - бесполезные данные. А чтобы понимать откуда ноги растут у данных, необходимо разбираться в самой предметной области, иметь в ней определенный опыт. Пример: дата-научник в сейсмике нафиг никому не нужен, но вот сейсмик с навыками дата-научности уже представляет практический интерес.
2. Люди - источник начала и конца всех проблем. А именно - если бизнес-процессу прям охота побаловаться с данными и извлечь из них тайный / скрытый умысел, то он нанимает голову, набитую спектром алгоритмов. Голова грокает данные и выдает на гора некую гипотезу, которая с той или иной степенью достоверности может быть внедрена в бизнес-процесс. Вопрос - несёт ли дата-научник ответственность за последствия сего внедрения? Вопрос скорее риторический, потому как практики заранее знают ответ.
а директор за свои решения ответственность несёт? :)
отличная статья, очень актуально! особенно спасибо за графику)
ууии спасибо! рады, что материал вам понравился