EconPapers    
Economics at your fingertips  
 

Анализ рисков потребительских кредитов с помощью алгоритмов машинного обучения // Consumer credit risk analysis via machine learning algorithms

Шалкар // Shalkar Байкулаков // Baikulakov () and Zanggar Belgibayev
Additional contact information
Шалкар // Shalkar Байкулаков // Baikulakov: Center for the Development of Payment and Financial Technologies

No #2021-4, Working Papers from National Bank of Kazakhstan

Abstract: Данное исследование представляет собой попытку оценки кредитоспособности физических лиц с помощью алгоритмов машинного обучения на основе данных, предоставляемых банками второго уровня Национальному Банку Республики Казахстан. Оценка кредитоспособности заемщиков позволяет НБРК исследовать качество выданных кредитов банками второго уровня и прогнозировать потенциальные системные риски. В данном исследовании были применены два линейных и шесть нелинейных методов классификации (линейные модели - логистическая регрессия, стохастический градиентный спуск, и нелинейные - нейронные сети, k-ближайшие соседи (kNN), дерево решений (decision tree), случайный лес (random tree), XGBoost, наивный Байесовский классификатор (Naïve Bayes)) и сравнивались алгоритмы, основанные на правильности классификации (accuracy), точности (precision) и ряде других показателей. Нелинейные модели показывают более точные прогнозы по сравнению с линейными моделями. В частности, нелинейные модели, такие как случайный лес (random forest) и k-ближайшие соседи (kNN) на передискредитированных данных (oversampled data) продемонстрировали наиболее многообещающие результаты. // This project is an attempt to assess the creditworthiness of individuals through machine learning algorithms and based on regulatory data provided by second-tier banks to the central bank. The assessment of the creditworthiness of borrowers can allow the central bank to investigate the accuracy of issued loans by second-tier banks, and predict potential systematic risks. In this project, two linear and six nonlinear classification methods were developed (linear models – Logistic Regression, Stochastic Gradient Descent, and nonlinear - Neural Networks, kNN, Decision tree, Random forest, XGBoost, Naïve Bayes), and the algorithms were compared based on accuracy, precision, and several other metrics. The non-linear models illustrate more accurate predictions in comparison with the linear models. In particular, the non-linear models such as the Random Forest and kNN classifiers on oversampled data demonstrated promising outcomes.

Keywords: потребительские кредиты; машинное обучение; банковское регулирование; стохастический градиентный спуск; логистическая регрессия; k-ближайшие соседи; классификатор случайных лесов; дерево решений; gaussian NB (Гауссовский наивный Байесовский классификатор); XGBoost; нейронные сети (многослойный персептрон); consumer credits; machine learning; bank regulation; stochastic gradient descent (linear model); logistic regression (linear model); kNN (neighbors); random forest classifier (ensemble); decision tree (tree); gaussian NB (naïve bayes); XGBoost; Neural network (MLP classifier) (search for similar items in EconPapers)
JEL-codes: E37 E51 G21 G28 (search for similar items in EconPapers)
Pages: 30 pages
Date: 2021
New Economics Papers: this item is included in nep-ban, nep-big, nep-cis, nep-cmp, nep-mac and nep-ore
References: View references in EconPapers View complete reference list from CitEc
Citations:

Downloads: (external link)
https://nationalbank.kz/file/download/68411 Russian language version (application/pdf)
https://nationalbank.kz/file/download/68412 English language version (application/pdf)

Related works:
This item may be available elsewhere in EconPapers: Search for items with the same title.

Export reference: BibTeX RIS (EndNote, ProCite, RefMan) HTML/Text

Persistent link: https://EconPapers.repec.org/RePEc:aob:wpaper:21

Access Statistics for this paper

More papers in Working Papers from National Bank of Kazakhstan Contact information at EDIRC.
Bibliographic data for series maintained by Saida Agambayeva ().

 
Page updated 2025-03-19
Handle: RePEc:aob:wpaper:21