Нырнуть в Data Science: что читать и смотреть, чтобы разобраться в машинном обучении и менеджменте

Data Science — одно из самых востребованных направлений ИТ. Виктор Кантор, директор центра Big Data МТС, советует курсы, книги и каналы, которые помогут разобраться в этой теме с нуля и научиться управлять командой DS и не только.

Нырнуть в Data Science: что читать и смотреть, чтобы разобраться в машинном обучении и менеджменте

Для совсем новичков

«Верховный алгоритм» Педро Домингос. Начнем с простого. Эта книга для тех, кто работает не непосредственно с Data Science, а в смежных сферах: маркетологов, продуктологов, HR, журналистов и других. Я, например, посоветовал ее своему пиарщику. Книга доступным языком объясняет, где используются больше данные и как работают алгоритмы. Не я один считаю ее полезной: Билл Гейтс рекомендовал «Верховный алгоритм» тем, кто хочет понять, что такое искусственный интеллект.

Для начинающих

Современные методы машинного обучения лучше учить по курсам Стэнфорда. Из классики советую базовую образовательную программу по NLP «CS224n: Natural Language Processing with Deep Learning» и компьютерному зрению «CS221n : Deep Learning for Computer Vision». Тем, кто с этими применениями глубокого обучения уже знаком, могу посоветовать курс по deep learning на графах - CS224w. И да, без английского языка стать успешным в Data Science не получится.

«Основы статистического обучения» Т. Хасти, Р. Тибширани, Д. Фридман. База на века от выдающихся специалистов, которая поможет разобраться в математических основах машинного обучения. Авторы рассказывают о методах статистического обучения и приводят множество примеров из практики. В дополнение хорошо бы почитать «Машинное обучение» К. Мерфи (Machine learning: probabilistic perspective) – талмуд на тысячу страниц из Массачусетского Технологического Института (MIT), в котором есть почти все из классических методов, стоящие внимания.

В дополнение можно выборочно полистать «Распознавание образов и машинное обучение» К. Бишопа. Эта книга позволяет по-другому посмотреть на алгоритмы, глубже разобраться в теории, но вряд ли поможет строить более точные модели.

Тем, кто хочет освоить базу Deep Learning снова посоветую книгу на английском: The Deep Learning textbook. Здесь собраны все самые востребованные на практике методы глубокого обучения. На Амазоне на эту книгу есть отзыв даже от Илона Маска — он считает ее единственной всесторонней работой по этой теме.

Для тех, кто «в теме»

Люблю Telegram-канал Время Валеры. Автор – Валерий Бабушкин, Head of Data Science в Blockchain.com — криптобиржи и ПО, которое включает самый популярный биткойн-кошелек в мире. Работал с данными в WhatsApp Integrity, X5 Retail Group и Яндексе. Во-первых, Валера – мой давний друг, а во-вторых, он честно пишет про то, как устроена работа data scientist в России и за рубежом, делится опытом и лайфхаками по руководству работой DS.

Подкаст «Техток». Парадокс – я редко слушаю подкасты, мне как-то ближе видео и текстовый формат, зато самому выступать в роли ведущего оказалось действительно интересно. Я веду подкаст «Техток», куда мы приглашаем лучших IT-специалистов России и по-честному обсуждаем их карьеру. Говорим об успехах, провалах, трудностях и вместе делаем выводы. Стараемся преподнести все так, чтобы интересно было и начинающим, и «прошаренным» ИТ-специалистам. Пообщались с CTO Ozon о главном качестве менеджера в ИТ, спросили основателя крупного стартапа Rubbles о том, зачем создавать свой проект, вместо того, чтобы сидеть на большой зарплате в Яндексе, узнали у главного аналитика Лаборатории Касперского, кто и как ловит киберпреступников и многое другое.

Для физиков и математиков

Математика – основа основ Data Science. Не знаете, с чего начать погружение в Big Data – начните с нее. Лекторий ФПМИ — мой любимый канал с лекциями Физтеха. Хорош для того, чтобы поностальгировать по студенческим временам, а иногда и узнать что-то новое.

«Теоретическая физика» Л.Д. Ландау, Е.М. Лифшиц – всемирно известный курс из десяти томов, у меня есть «Механика», «Теория поля», «Квантовая механика» и «Статистическая физика». К Data Science отношения не имеет, но позволяет насладиться применением мощного математического аппарата к реальному миру. Мне нравится изложение этих учебников, как описываются явления и применяется математический аппарат. Листаю их периодически и думаю — может, еще не поздно все бросить и заняться физикой?

Для менеджеров

«Deadline. Роман об управлении проектами» Тома ДеМарко — книга, которую круто прочесть начинающим менеджерам. В отличие от значительной части non-fiction литературы читается действительно как роман, при этом можно вынести миллион полезных лайфхаков — по управлению конфликтами, построению команды, работе в режиме «все горит, и мы горим» и многому другому.

«Эссенциализм. Путь к простоте» Грега МакКеона — лучший учебник по тайм-менеджменту. Основная идея очень проста: не нужно делать все, нужно делать только то, что действительно важно. Звучит хорошо, но реализовать этот принцип в жизни очень непросто. Книга подскажет, как расставить приоритеты, что такое выученная беспомощностькак ее избежать, и как работать не 24/7, а головой.

3434
10 комментариев

Тут, конечно, все в кучу свалили: и учебники, и математику, и менеджмент. Не знаю, что там по технической части, но для смежных спецов – неплохая подборка. Я когда на новый продукт перешла, тоже верховный алгоритм читала, мне зашло

3
Ответить

Потрясающий кейс (сарказм)

2
Ответить

Восторгающие инсайты

Ответить

Это наверное такая шутка

1
Ответить

Спасибо за подборку литературы

1
Ответить

Бабушкин прикольный, я его выступления на паре конф видел. Не знал, что у него свой канал

Ответить

Кусок для менеджеров интересный. В DS все равно на одних книгах не вкатишься, образование нужно, а вот про управление интересно почитать

Ответить