Как маркетологу рассчитать доверительный интервал? И зачем?
Правильный ответ "маркетологу ничего расчитывать не нужно. Он все будет делать субъективно и принимать решения основываясь на интуиции, а не на данных." Маркетолог вообще должен работать, так как ему удобно, а не эффективно.
Если, вы все же решили посчитать этот confidence interval, то есть нюансы. Возьмем данные из live-demo, которое показывает посещаемость страницы metrica.yandex.com/promo/product. Просто скачаем данные по прямой ссылке (нужно иметь аккаунт в Яндексе).
Предположим, я маркетолог, скачал данные за 7 дней и получил конверсию:
"Для любых целей" - 16.68%
"Для избранных целей" - 8.79%
Самое простое решение которое приходит в голову, это использовать онлайн калькулятор (как учат на курсах по маркетингу). Куда тут это надо подставлять:
Ну в "Оценка конверсии" надо вставить среднюю конверсию за период. Я ее только что подсчитал, а вот что такое "Пользователей в выборке"? Это типа "выборка из генеральной совокупности"?Пользователей вообще в рекламе не считают. Может это визиты или сессии (если это Гугл)? Но у нас есть подсказка - N (большая). Ага! Обычно n маленькой записывают число наблюдений в выборке. А их у меня было 7.
Размышляя таким образом, я получу доверительные интервалы:
-10.94% – 44.30% "Для любых целей" и
-12.19% – 29.77% "Для избранных целей"
Интервалы получились довольно широкие, т.к. наблюдений в выборке всего 7.
Но что калькулятор мне насчитал? Как это проверить. Я напишу простую программу на Питоне и т.к. формулы можно найти в любом учебнике, то для расчета верхней и нижней границы я буду использовать:
где,
Загрузим данные:
Выполним расчеты:
Получатся интервалы:
14.3525% - 19.0226% для "Для любых целей" и
7.6046% - 9.9917% для "Для избранных целей"
Результат сильно отличается от расчетов на калькуляторе.
Но начальник может мне сказать "Т.к. данные всего за 7 дней, доверительный интервал должен получится очень широкий". И в чем-то будет прав. Поэтому, я скачал данные за 1277 дней и давайте немного модифицируем код:
Получились интервалы:
18.9746% - 19.5771% для "Для любых целей" и
10.7067% - 11.0474% для "Для избранных целей"
Действительно, интервалы стали уже, но не такими уже и узкими.
Подставлю те же данные в онлайн калькулятор.
Результат:
17.06% – 21.48% для "Для любых целей"
9.16% – 12.58% для "Для избранных целей"
Интервал получился уже, но отличается от Питона. Сколько ж ему наблюдений надо, чтобы стало совсем узко?
Но, начальник скажет: "Ты рассчитал доверительный интервал для нормального распределения, а данные по конверсии не распределены нормально". Откуда он это знает? Он что тест Колмогорова-Смирнова на нормальность сделал? А в учебнике написано "Важно: рассчитать доверительный интервал можно только для нормально распределённых данных." Обратите на это внимание!!!
Взглянем на гистограмму данных:
Давайте Q-Q диаграмму я строить не буду. Оставим это для факультативного изучения. Ну, p-value 0.07 такое себе, все равно очень маленькое, так что скорее всего начальник прав, т.к. видно несколько центров данных. Обычно данные по конверсии сильно разрежены, и получается сверхтяжелый хвост около нуля (возможно, данные для примера я не самые удачные взял).
И надо использовать метод бутстрэппинга, код на Питоне будет вот такой:
И получаем результат для "Всех целей":
Доверительный интервал для CR при 100 выборках (бутстрэппинг): 18.9441% - 19.5777%
Доверительный интервал для CR при 10000 выборках (бутстрэппинг): 18.9707% - 19.5781%
Доверительный интервал для CR при 100000 выборках (бутстрэппинг): 18.9748% - 19.5754%
И для "Избранных целей":
Доверительный интервал для CR при 100 выборках (бутстрэппинг): 10.6679% - 11.0312%
Доверительный интервал для CR при 10000 выборках (бутстрэппинг): 10.7074% - 11.0477%
Доверительный интервал для CR при 100000 выборках (бутстрэппинг): 10.7055% - 11.0471%
Т.е. я сделал 100, 10 тыс. и 100 тыс. выборок из данных, и результаты получились аналогичные с методом для нормального распределения. Т.е. больше 10 тыс. выборок можно было и не делать.
Так что же я только что посчитал? Я же должен был объяснить в начале статьи зачем доверительные интервалы расчитывать.
Доверительный интервал нужен, для того чтобы:
1. Оценить истинный диапазон значений.
2. Указать на надежность оценки измерения.
Если мы загрузили данные за 7 дней, это много или мало? Конверсия же может отклонятся от средней в ту или иную сторону. Насколько надежная такая оценка? Именно на эти вопросы и отвечает доверительный интервал. Если этот интервал "широкий", значит такая оценка не очень надежна. Если же "узкий", то наоборот.
Выводы:
В этой статье я рассмотрел вопрос, почему не стоит использовать всякие непонятные онлайн калькуляторы на сайтах. Т.к. вы не знаете, какие программисты и по каким формулам их писали.
Все доверительные интервалы рассчитанные разными способами получились примерно одинаковыми. Тем не менее, вопрос "Как именно дисперсия влияет на ширину доверительного интервала?" остается открытым.
Если у вас значение выходит за границы доверительного интервала, то видимо стоит начать беспокоится и изучить причины отклонения.
Если вы хотите, чтобы я написал статью по расчету доверительного интервала в Excel, напишите мне в комментариях об этом.
Хорошая подача инфомарции, о проблемах насущих, +1 лайк за стаью!
Занимательно! Тема важная и нужная, теперь жду статью про расчёт в Эксцеле👏