Библиотека PyTorch Forecasting как "серебряная пуля" в прогнозировании спроса
В предыдущей статье я писал про применения ML для дистрибьюторов и производителей потребительских товаров при прогнозировании спроса.
Давайте обсудим, как при построении модели спроса максимально упростить жизнь специалисту по данным. А именно поговорим о библиотеке PyTorch Forecasting.
Временные ряды
PyTorch Forecasting это библиотека для работы с временными рядами.
Напомню, что временной ряд - это упорядоченная по времени последовательность показателей.
Простой пример временного ряда - зависимость продаж от сезонов или от дней недели. Зимой лучше продаются валенки, а летом - купальники. По будням больше покупают в деловом центре города, а по выходным - в спальных районах.
Что это означает с точки зрения работы с данными? Рассмотрим на примере обучающей и тестовой выборки. Когда мы берем не зависящий от времени набор данных, то можно случайным образом взять фрагменты данных и использовать как тестовые. А при работе с временными рядами так делать неправильно. Потому что если для прогнозирования продаж валенок в феврале взять данные за май - июль, то можно случайно обогатить производителей угги, например.
Преимущества библиотеки PyTorch Forecasting
Библиотека PyTorch Forecasting позволяет решить задачу прогнозирования спроса даже не сильно опытному специалисту по данным. Ее суть в большом количестве предобработки. Получив указание, какими данными воспользоваться, она их сама масштабирует. Кроме того она оценивает, какой из большого количества факторов влияет на результат. Она укажет, если при изменении какого-то фактора сильно возрастает ошибка.
Для задач прогнозирования спроса отдельно можно выделить следующие особенности:
- исследует несколько временных рядов одновременно. Это актуально, например, если у нас есть данные по продажам конкурентов за схожие периоды
- автокорреляция, т.е. исследует, как ряд вел себя в прошлом, чтобы спрогнозировать, как будет вести себя в будущем.
- учитывает внешние факторы, такие как курс доллара, евро, погоду и т.д.
- учитывает эффекты каннибализации
- делает перцентильный прогноз, т.е. дает наихудшую и наилучшую оценку прогноза
С учетом перечисленного сегодня с помощью PyTorch Forecasting собираются большинство решений для крупного бизнеса в России и СНГ.
Вместо вывода
В предыдущей статье мы обсудили, что можно сделать с помощью ML, а в этой - как. Существуют и другие библиотеки, о которых в другой раз. Но PyTorch Forecasting - отличный инструмент. Специалисту по данным обязательно надо иметь его ввиду при построении моделей спроса.