Данная статья, в первую очередь, будет интересна банкам, хотя не только им, но любым организациям занимающимся расчётам рисков по выплатам клиентов не только в части выдачи кредитов. Также данная статья и подходы изложенные в ней будут интересны всем кто занимается datascience и разработкой нейронных сетей.
Скоринговая модель должна оценивать не только вероятность возврата кредита (Тело+%),но и динамически рассчитывать сумму, при которой эта вероятность максимальна или диапазон размера кредита, при котором она допустима в заданном диапазоне вероятностей.
Если брать примитивные скоринговые модели, которые выходят на вероятности, то само собой это достижимая задача. Тот же первый пример с учётом логистической регрессии это позволяет сделать.
Проблема только в том, что такие подходы не позволяют всего остального с точки зрения бизнеса.
То, что говорите вы ведь можно рассчитать и через платежную дисциплину. То есть, варьируя параметрами можно выявить когда человек будет платить без задержек и просрочек.
И с точки зрения логики это и будет той самой нужной вам вероятностью, которая говорит о том, что кредит вернут.
То же самое можно сделать и для тела кредита.
Оперируя вероятностями вы не можете посчитать риск в абсолютном выражении. То есть, в долларах.
Приведу самый простой пример. Например, клиент с вероятностью 86% вернёт кредит. Это много или мало?? Сколько ему установить % ставку?? Или другой клиент, у которого вероятность 96%.
Допустим это максимальная вероятность возврата кредита на неком диапазоне условий.
Давайте рассуждать логически. Эта вероятность ведь не 100% в обоих случаях. То есть, риск есть. Но каков он по абсолютно величине??
И скоринговые модели основанные на вероятностном подходе не могут ОБОСНОВАННО назвать эту величину.
Да вы можете установить волевым решением и эмперически, что допустим каждый процент вероятности это +0,1% ставки по кредиту. Но у вас будет огромная погрешность, что будет выражаться в том, что вы к рассчетному риску для клиента будете вынуждены накинуть ещё риски банка.
И получается так что у вас итоговая процентная ставка это костыльная величина, которая уже благодаря тому, что банк не может адекватно посчитать риски перегружает клиента.
Если вы знаете достаточно точно риски в абсолютном выражении, если вы знаете сколько вы можете нагрузить клиента благодаря тому что сказали вы (при подборе параметров на определенных условиях) тогда вы можете адекватно взвесить риски по каждому клиенту и не перегружать остальных.
Вероятностный подход этого не даст.
Он просто не может ответить, сколько в валюте составляет риск, чтобы как минимум компенсировать издержки банка.