Я ограничилась скриншотом рандомного приложения, но на этом примере мы видим - чаще всего встречается оценка 5. 4, 3 и 2 примерно с одинаковой частотой, а 1 снова чуть больше. Если провести черту по среднему значению этого графика (4,3), то большинство оценок будут находится в правой части. Таким образом, для исследования такой выборки нам не подойдёт ряд статистических критериев, справедливый для нормального распределения.
О том, как понять, нормальное ли распределение перед нами и какие критерии подходят для разных видов распределения, разберём в следующем посте.
Мода, медиана и среднее значение
Последнее, на чем остановимся сегодня, это понятия моды, медианы и среднего значения.
Мода - это наиболее часто встречающийся показатель в массиве. Моду можно вычислить как для нормального, так и для ненормального распределения. Единственное, при нормальном распределении она будет находится на самой верхушке нашего колокольно-верблюдного графика или рядом с ней, а при ненломальном - не обязательно. Чем полезно вычисление моды для бизнеса? Зная наиболее частную комбинацию, мы можем к ней подготовиться. Так, например, если мы понимаем, что посетители кофейни часто покупают по 2 стаканчика кофе, то мы можем предложить им удобную упаковку для переноса. Более тревиальный пример - обувь стандартного размера (37-39 для девушек) в магазинах покупается чаще, значит, нужно заказать/изготовить больше экземпляров данных размеров. Так же упомяну, что мод в массиве может быть несколько. Такой показатель будет полимодальным.
Среднее значение - значение, которое является средним арифметическим от суммы всех чисел в массиве. Анекдот про то, что "Если кто-то ест мясо, а я ем капусту, то мы в среднем едим голубцы" - это как раз про среднее значение. Если оно используется в нормальном распределении, будет показательно, если нет - может привести к ошибочным выводам.
Медиана - это значение, которое находится в середине числового ряда, ранжированного по порядку, и как раз оно может дать более точную картину в случае ненормального распределения. Как мы можем использовать это в бизнесе? Например, подписку купили 10 человек, из них 6 по 1000 рублей, 1 за 2000, 3 по 3000 рублей и 1 за 10000 рублей. Если мы будем считать среднее, то получится, что каждый клиент принёс по 2000 рублей. Такая оценка может не совсем корректно отображать действительность. В таком случае нужно использовать медиану - для её вычисления нужно расположить числа в порядке возрастания, выбрать 2 числа из середины ряда и разделить на 2. Ну или рассчитать автоматически с помощью онлайн-калькуляторов, Excel, sql и прочих инструментов. И наша медиана в данном случае будет равна 1500. Разница в четверть, внушительно?)
Спасибо, освежили азы. А правило 3 сигм скоро будет? )
Спасибо☺️ Не планировала подробно на нем останавливаться, просто рассказать, что оно есть. Думаю в следующий пост положить, вместе со стандартным отклонением.