Подборка рабочих примеров обработки данных
По стопам моей первой подборки датасетов для машинного обучения сделаю ещё одну — подборку относительно свежих датасетов с рабочими примерами по обработке данных.
Ведь ни для кого не секрет, что обучение на хороших примерах проходит эффективнее и быстрее. Посмотрим, что интересного нам смогут показать одни из лучших примеров по обработке данных.
Схема работы с этим постом такая же, как с моим предыдущим про лучшие блокноты по ML и DS, а именно: сохранил в закладки → передал коллеге.
Также бонусом в конце статьи — крутой курс от ФПМИ МФТИ.
Итак, давайте приступим.
Подборка датасетов с рабочими примерами обработки данных
Сравнение социально-экономической информации с показателями самоубийств по годам и странам.
Примеры обработки:
Ежедневный рейтинг 200 самых прослушиваемых песен пользователями Spotify в 53 странах — с 2017 года по 2018 год.
Пример обработки:
Записи из Бостонской системы отчетов о происшествиях с преступностью, включающая в себя происшествия и информацию о том, когда и где оно произошло.
Пример обработки:
Категории, рейтинги, размер всех приложений Google Play.
Пример обработки:
Статистика и особенности покемонов.
Пример обработки:
Данные заголовков новостей, опубликованных за последние 15 лет.
Пример обработки:
Полная история авиакатастроф по всему миру — с 1908 года по настоящее время.
Пример обработки:
Высококачественный набор данных для задачи обнаружения сарказма.
Пример обработки:
Данные о качестве воздуха, собранные на наружных мониторах по всей территории США.
Пример обработки:
Анализ питания каждого пункта меню в McDonald's США.
Пример обработки:
Детали, комплекты, цвета и запасы каждого официального набора Lego в базе данных Rebrickable.
Пример обработки:
Объёмы импорта и экспорта для 5000 товаров в большинстве стран мира за последние 30 лет.
Пример обработки:
Полная информация о различных аспектах преступлений, совершенных в Индии с 2001 года.
Пример обработки:
Данные по пульсарам, собранные во время обзора Вселенной.
Примеры обработки:
Данные, показывающие равенство и неравенство во Франции.
Пример обработки:
Данные переписи в США.
Пример обработки:
Цены на жилье в Калифорнии.
Пример обработки:
Данные по безработице министерства труда США.
Пример обработки:
Набор записей, которые детализируют информацию о персонажах игрока в игре с течением времени.
Пример обработки:
Данные о событиях гравитационных волн GW150914.
Пример обработки:
Бонус
А бонусом у нас сегодня будет прекрасный курс по Deep Learning, рассчитанный на старшеклассников, интересующихся программированием и математикой, а также студентов, которые хотят начать заниматься глубоким обучением.
Цель курса — познакомить с основными принципами глубокого обучения (нейронных сетей) в интерактивном формате и на примере практических задач.
Программа курса
- Python: основы, Google Colab.
- Введение в линейную алгебру. Векторы. Матрицы и операции с ними. Библиотека NumPy.
- Библиотеки Pandas и MatPlotlib. Основы машинного обучения.
- Элементы теории оптимизации. Градиент. Градиентный спуск. Линейные модели.
- Введение в глубокое обучение. Перцептрон. Нейрон с сигмоидой (и другими функциями активации). Основы ООП в Python.
- Библиотека PyTorch. Многослойные нейросети.
- Обучение нейронных сетей на практике. Cifar10, notMNIST.
- Сверточные нейросети. Сверточный слой. Пулинг слой.
- Практика обучения нейросетей. Классификация дорожных знаков.
- Transfer Дearning. Популярные в Computer Vision архитектуры.
- Сегментация картинок. U-Net.
- Участие в соревнованиях на Kaggle.
- Object Detection. YOLOv3.
- Классический GAN. Нейронный перенос стиля.
- Базовые методы обработки текста.
- Word Embeddings.
- Рекуррентные нейронные сети.
- LSTM, GRU ячейки.
- Языковые модели.
- Машинный перевод.
- Text2Speech.
- SuperResolution.
Также вы можете заглянуть на YouTube-канал Deep Learning School. Там много отличных видео ;)
На этом наша короткая подборка примеров обработки данных подошла к концу. Надеюсь, вы узнали для себя что-нибудь новое. Как принято на vc.ru, понравился пост — поставь плюс и не забудь поделиться с коллегами.
Также, если у вас есть то, чем вы можете поделиться сами, — пишите в комментариях. Больше информации о машинном обучении и Data Science здесь.
Всем знаний!
0 комментов и десятки закладок это видимо "нихрена не понял, но должно пригодиться"
(оставил мудрый комментарий с умным видом)
Не скрою- глубоко не вдавался в статью, но все же возник вопрос: для чего она вообще? Не то чтобы я критикую автора, но я реально не врубился о чем она, тут же просто сайты со статистикой?
Эту статью нужно скормить AI, чтобы он выявил закономерности в этом датасете датасетов. Вручную такое никто не читает, не парься.
Курсы в школе [https://www.dlschool.org/] бесплатные? Всех берете или жесткий отбор?