Prediction of the stable part of funds on customer accounts /
Прогноз объема стабильных средств на расчетных счетах клиентов без сроков погашения
Почему это важно? Номинально, все средства на расчетных счетах клиенты могут в любой момент забрать из Банка, а в ожидании этого Банк не может их использовать в долгосрочном/ среднесрочном плане (например, для выдачи кредитов). Получается, что в такой ситуации Банк ничего не зарабатывает, но платит клиентам проценты по средствам на их счетах, пусть и не высокие, но в масштабах бизнеса Банка эти убытки могут быть значительны.
В реальности поведение клиентов другое, оно зависит от многих факторов (поведенческих, макроэкономических, действий конкурентов и т.д.). Клиенты не забирают сразу все свои средства с расчетных счетов, а какое-то время их там хранят, поэтому суммарно по всем клиентам на их расчетных счетах всегда находится какой-то объем средств, который хоть и меняется со временем, но может быть расценен Банком как стабильный и использован для выдачи кредитов (а Банк на этом зарабатывает).
Умение точно прогнозировать объем и динамику стабильного остатка средств на расчетных счетах позволяет Банку зарабатывать на кредитовании, но при этом держать в приемлемых рамках риск того, что клиенты могут в любой момент потребовать эти средства назад – это называется "управление риском ликвидности". Для этого строится ML модель прогнозирования стабильного остатка средств на расчетных счетах клиентов, связанная с моделями прогноза рынков, макроэкономики и поведения клиентов.
В приложенном файле представлены подневные данные объема расчетных счетов физических лиц. В отличие от депозита, клиент может снять всю сумму с расчетного счета в любой момент времени без каких-либо «штрафов». Такой продукт называют Undefined Maturity Product – UMP). Однако маловероятно, что все клиенты разом закроют свои счета в Банке. Всегда кто-то снимает деньги, а кто-то пополняет счет – есть некоторый стабильный уровень, ниже которого не опустится суммарный объем расчетных счетов.
Например, если бы мы знали будущее объема расчетных счетов, как на этом рисунке, то стабильная часть на 1 месяц (1м) была бы на уровне, обозначенным фиолетовым цветом. Это тот уровень, который не пробивается на протяжении 1 месяца. Аналогично 2м – синий, 3м – зеленый, 4м – оранжевый.
Задача:
Для временного ряда в файле ВС DS Сбер data.csv необходимо построить модель, которая оценивает объем стабильной части средств на дату.
Например:
model_forecast
(2019-02-01, ‘1М’, История_до_2019-02-01) = стабильная часть на 1М
Возможные горизонты: 1М, 2М, 3М, 4М, 5М, 6М, 7М, 8М, 9М, 10М, 11М, 12М
Критерии качества модели:
Нужно одновременно минимизировать величины:
-
максимальный объем пробития стабильный части на валидационной выборке
-
фактическая стабильная часть – модельная стабильная часть