На несчастьях денег не заработаешь?

На несчастьях денег не заработаешь?

Травмы, подрывы, экологические катастрофы — это все печально.

Но только не для страховых компаний, которые ежедневно выбивают чеки на несчастные случаи, рассчитывая на отсутствие ЧП. Страховым несчастье людей дает прибыль, но и увеличивает убытки.

Именно поэтому компаниям необходимо постоянно балансировать между: а как бы нам не обанкротиться в случае землятресения в японском городке Осака и забрать как можно больше средств у страховщиков.

Для оценки рисков применяются статистические методы, например, Паретто… Но далеко не всегда компании успевают адекватно оценить рынки и выдать соразмерный чек клиенту. При помощи нейросетей этот процесс можно сильно упростить.

О том и пишем в новом обзоре GradientAI.

Страхование по своей сути основано на модели взаимного покрытия рисков, где взносы многих участников должны покрывать убытки небольшого количества пострадавших.

Важнейшая задача для страховщика — точное прогнозирование вероятности наступления страховых случаев и корректной оценке премий, которые позволят компенсировать убытки, сохраняя при этом прибыльность бизнеса.

Одной из основных проблем страховых компаний является асимметрия информации между страхователем и страховщиком. Страхователь часто обладает большей информацией о своих рисках, чем страховщик, что может привести к адверсальному отбору и моральному риску.

Адверсальный отбор возникает, когда лица с высоким уровнем риска чаще заключают страховые контракты, чем лица с низким риском, что увеличивает общие убытки компании.

Моральный риск проявляется в том, что застрахованное лицо может действовать менее осторожно, зная, что в случае наступления страхового случая убытки будут компенсированы страховкой.

Представьте себе выступающего профессионального спортсмена, берущего максимальную страховку перед договорным бойцовским матчем. Конечно, такие ситуации непостоянны. Но попытки обмануть страховые компании или неосторожность после получения страховок часто приводят к настоящим спорам.

Для борьбы с этими проблемами страховые компании внедряют детальный андеррайтинг, использование больших данных для оценки поведения страхователей и включение механизмов франшизы, когда часть убытков остается на стороне страхователя.

Актуарные модели базируются на принципах теории вероятностей и математической статистики.

На несчастьях денег не заработаешь?

Например, в страховании жизни используется таблица смертности, которая отражает вероятности смерти для каждой возрастной группы на основании демографических данных, болезней лиц в разных регионах страны и даже поведенческие характеристики с выбором профессии.

Скажем так, риски смерти безработных от алкогольной интоксикации выше…

Аналогично, в страховании имущества учитываются статистические данные о частоте и размере убытков в зависимости от характеристик объекта. В Японии, вероятно, компании идут с особыми условиями на страхование зданий…

Актиуары должны построить функцию распределения вероятностей для каждого вида страхования, чтобы предсказать, насколько велики будут убытки и как часто они будут возникать.

Например, для моделирования страховых случаев с редкими, но крупными убытками, как это часто бывает в страховании катастроф или крупных промышленных объектов, могут использоваться распределения с «толстыми хвостами», например, Парето или логнормальное распределение.

Распределение Парето можно описать так: вероятность определенного уровня ущерба зависит от минимального возможного ущерба и некоторого параметра, который показывает, насколько редко встречаются события с большими убытками.

Чем больше этот параметр, тем меньше вероятность наступления катастрофического события. Однако для редких событий с очень большими убытками эта вероятность убывает медленно, что и характеризует «толстый хвост» распределения.

Хвостовая вероятность, или вероятность того, что ущерб превысит определенное значение, также уменьшается по степенному закону.

Это означает, что хотя вероятность крупных убытков невелика, она остается заметной даже при значительном увеличении размера ущерба, что особенно важно для страхования катастрофических рисков.

Математическое ожидание убытков, или средний ущерб, может быть очень большим, если значение параметра, отвечающего за редкость событий, близко к единице. В случае катастрофы ущерб может быть значительно выше среднего, что требует особого внимания при оценке таких рисков.

На несчастьях денег не заработаешь?

Для измерения вероятности больших убытков используется показатель Value at Risk (VaR). Он отражает максимально возможный ущерб с заданной вероятностью. Чем меньше параметр, показывающий редкость событий, тем больше будет значение VaR, а значит компании должны быть готовыми отдавать огромные финансы в случае ЧП.

Важным аспектом в актиуарных моделях является корректировка премий с учетом будущих изменений внешних условий. Это может включать прогнозирование инфляции, экономических кризисов или изменений в законодательстве, которые могут повлиять на размер выплат.

В таких случаях используется дисконтирование, когда будущие выплаты приводятся к текущей стоимости, что позволяет учесть временную стоимость денег.

Короче говоря, страхование — это целая плеяда комбинаторных игр и статистики, которой необходимы актуальные данные и автоматические расчеты. Ситуация аналогична кредитному скорингу в банковских системах.

На несчастьях денег не заработаешь?

Для задач классификации, например, при прогнозировании вероятности наступления страхового случая, обычно используется кросс-энтропийная функция потерь, которая минимизирует расхождение между истинными и предсказанными вероятностями.

В страховых задачах эта функция позволяет эффективно работать с данными, где каждая запись представляет собой вероятность наступления события (например, повреждение имущества, смерть или другие страховые случаи).

Для задач регрессии, таких как прогнозирование размера убытков или стоимости будущих выплат, часто используется среднеквадратичная ошибка (MSE), которая минимизирует среднеквадратичное расхождение между предсказанными и фактическими значениями убытков.

Однако в специфических страховых задачах, где необходимо учитывать редкие, но высокозатратные события, могут быть использованы взвешенные функции потерь, которые придают больший вес редким, но критическим наблюдениям, что позволяет модели уделять больше внимания аномальным ситуациям.

Стандартный градиентный спуск работает эффективно на относительно простых данных, но в страховых данных, где присутствуют сильные выбросы и несбалансированные классы (например, подавляющее большинство клиентов может не предъявлять претензий, но небольшое количество претензий несет огромные убытки), важно применять адаптивные алгоритмы оптимизации, такие как Adam (Adaptive Moment Estimation) или RMSprop.

Эти методы адаптируют шаг обучения для каждого веса, что особенно важно для данных с высоким уровнем шума или при наличии аномальных наблюдений. Adam, например, использует адаптивные скорости обучения для каждого параметра сети, основанные на первых и вторых моментах градиентов, что ускоряет сходимость и улучшает качество обучения на разнородных данных.

Регуляризация является важным компонентом в страховой аналитике, так как модель может быть склонна к переобучению на данных с ограниченной выборкой и значительным уровнем шума.

Одним из стандартных методов регуляризации является L2-регуляризация, которая добавляет штраф к функции потерь за слишком большие веса, что предотвращает чрезмерное влияние отдельных признаков на результат.

Для более сложных архитектур часто используется метод дропаут (dropout), который во время обучения случайным образом «выключает» определенный процент нейронов, что предотвращает зависимость модели от определенных нейронов и улучшает её обобщающую способность.

Это особенно важно в страховании, где необходимо учитывать большое количество факторов, и важно, чтобы модель не делала предсказания, основываясь только на небольшом наборе наиболее информативных признаков.

Но в целом классический страховой механизм андеррайтинга через нейросети часто работают через графовые структуры или через методы классификации, логистической регрессии в случае одночастных страховых практик, где легко найти конечное число факторов, влияющих на результаты страхования.

На несчастьях денег не заработаешь?

Впрочем, многим компаниям выгодно искать, как и в скоринге, скрытые закономерности.

Например, в одной из коммерческих компаний России выяснилось, что люди, которые задерживают на 30 дней подачу документов о страховом случае, с вероятностью на 25% ниже пролонгируют свой договор страхования.

Если искусственный интеллект (ИИ) будет задействован в процессе андеррайтинга, он сможет значительно улучшить и автоматизировать сбор данных, что, в свою очередь, повысит эффективность и качество оценки рисков.

Например, в типичной анкете для подачи заявки на страхование может быть около двадцати вопросов. Обычно андеррайтер, проверяя заявку, связывается с клиентом, чтобы задать дополнительные вопросы и получить больше информации. Однако с использованием ИИ можно предсказать, какие именно вопросы стоит задать еще на этапе подачи заявки. Это не только снизит нагрузку на андеррайтера, но и позволит собрать дополнительные данные, которые улучшат качество заявки.

Кроме того, для сбора дополнительных данных можно использовать разнообразные источники информации, такие как селфи клиентов, записи медицинских карт (EHR), видео и данные о физической активности. Все эти элементы предоставляют более глубокую и полную информацию о клиенте, что делает систему андеррайтинга более точной и надежной.

Но реализация ИИ в страховой сфере — это лишь естественный виток автоматизации экономики при помощи ИИ. Это тот же стандартный случай, что и с облачными дата-центрами, о которых мы писали уже когда-то давно… Поэтому реализация ИИ именно в этой сфере — одна из самых простых и понятных наравне с кредитным скорингом и создании облачной экосистемы.

Начать дискуссию