انتخاب ویژگی‌های بهینه به‌منظور تعیین ریسک اعتباری مشتریان بانکی

نوع مقاله: مقاله پژوهشی

نویسندگان

1 استادیار، گروه مهندسی صنایع، دانشکدۀ فنی و مهندسی، دانشگاه پیام نور (نویسنده مسئول)؛

2 کارشناسی ارشد، مهندسی صنایع، دانشکدۀ فنی و مهندسی، دانشگاه پیام نور

چکیده

 
 
ریسک اعتباری که به معنی احتمال عدم بازپرداخت تعهدات توسط مشتریان در سررسید تعبیر می‌شود به‌عنوان یکی از عوامل ورشکستگی مؤسسات مالی قلمداد می‌شود. بدین منظور از تکنیک‌های داده‌کاوی نظیر شبکه عصبی، درخت تصمیم، شبکه بیز، k نزدیک‌ترین همسایه و ماشین بردار پشتیبان برای دسته‌بندی مشتریان به مشتریان پر ریسک و کم ریسک استفاده شده است. در این مقاله یک روش ترکیبی از الگوریتم بهینه‌سازی رقابت استعماری و شبکه عصبی برای افزایش دقت دسته‌بندی در ارزیابی و سنجش ریسک اعتباری مشتریان بانکی ارائه می‌دهد. این روش با شناسایی زیر‌مجموعه‌ی ویژگی‌های بهینه و حذف ویژگی‌های غیرضروری از تمامی ویژگی‌های موجود در داده‌ها به کاهش ابعاد مسئله و افزایش دقت طبقه‌بندی می‌‌پردازد. رویکرد پیشنهادشده بر روی مجموعه داده‌های واقعی پایگاه داده UCI و همچنین داده‌های واقعی یک بانک خصوصی ایرانی به‌منظور اعتبارسنجی اعمال شد. نتایج تجربی به‌دست‌آمده نشان داد میزان خطای شبکه عصبی برای مجموعه آزمون با انتخاب ویژگی‌های مؤثر و حذف ویژگی‌های کم اثر توسط الگوریتم بهینه‌سازی صفر و یک رقابت استعماری کاهش می‌یابد. بعلاوه، برای سایر روش‌ها طبقه‌بندی استفاده شده، میزان خطای داده آزمون در حد قابل قبولی باقی می‌ماند. برای اولین بار در این مقاله از الگوریتم رقابت استعماری برای ارزیابی ریسک اعتباری مشتریان بانکی استفاده شده است.
 
 

کلیدواژه‌ها


عنوان مقاله [English]

Optimal Feature Selection in order to Bank Customer Credit Risk Determination

نویسندگان [English]

  • Mojtaba Salehi 1
  • Alireza Korde Katooli 2
1 Assistant Professor, Department of Industrial Engineering, Faculty of Engineering, Payame Noor University, (Corresponding Author: m.salehi61@chmail.ir)
2 MSc, Industrial Engineering, Faculty of Engineering, Payame Noor University
چکیده [English]

Credit risk interprets as the probability of obligations non-repayment by customer in due date is considered as one of causes financial institutions bankruptcy. For this purpose, data mining techniques such as neural networks, Decision Tree, Bayesian networks, Support Vector Machine is used for customer segmentation to high-risk and low-risk groups. In this paper, we present the hybrid Imperialist Competitive optimization algorithm and neural network for increasing classification accuracy in evaluation and measurement credit risk of bank customers. The proposed method identifies the optimistic features and eliminates unnecessary features decreases problem dimension and increases classification accuracy. To validate this method, it implements on UCI dataset and also on a reality dataset of a private Iranian bank. The experimental results show this method is more satisfactory than other data mining techniques. The neural network error for the test set decreases with selection of effective features and elimination of low-impact features by the Binary Imperialist Competitive Optimization Algorithm.
In addition test data error rate remains at acceptable level for other used classification methods. This article is the first use of algorithms Imperialist Competitive for credit risk assessment of bank customers.
 

کلیدواژه‌ها [English]

  • : Optimized Features
  • Credit Risk
  • Banking Customers
  • Classification
  • Data mining
 

[1]        “اصول مدیریت ریسک اعتباری کمیته بال” , بانک و اقتصاد(78), 78, 27–29, 1385.

 

[2]        Kohavi R., Kohavi R., “Wrappers for feature subset selection” , Artificial Intelligence, 97, 1-2, 273–324, 1997.

 

[3]        Blum A. L., Rivest R. L., “Training a 3-node neural network is NP-complete” , Neural Networks, 5, 1, 117–127, 1992.

 

[4]        Oreski S., Oreski G., “Genetic algorithm-based heuristic for feature selection in credit risk assessment” , Expert Systems with Applications, Elsevier Ltd, 41, 4 PART 2, 2052–2064, 2014.

 

[5]        Marinaki M., Marinakis Y., Zopounidis C., “Honey Bees Mating Optimization algorithm for financial classification problems” , Applied Soft Computing Journal, Elsevier B.V., 10, 3, 806–812, 2010.

 

[6]         Oreski S., Oreski G., “Genetic algorithm-based heuristic for feature selection in credit risk assessment” , Expert Systems with Applications, Elsevier Ltd, 41, 4, 2052–2064, 2014.

 

[7]        Hsieh N.-C., “An integrated data mining and behavioral scoring model for analyzing bank customers” , Expert Systems with Applications, 27, 4, 623–633, 2004.

 

[8]        Piramuthu S., “On preprocessing data for financial credit risk evaluation” , Expert Systems with Applications, 30, 3, 489–497, 2006.

 

[9]        Carling K., Jacobson T., Lindé J., Roszbach K., “Corporate credit risk modeling and the macroeconomy” , Journal of Banking & Finance, 31, 3, 845–868, 2007.

 

[10]      Finlay S., “Multiple classifier architectures and their application to credit risk assessment” , European Journal of Operational Research, Elsevier B.V., 210, 2, 368–378, 2011.

 

[11]      Yap B. W., Ong S. H., Husain N. H. M., “Using data mining to improve assessment of credit worthiness via credit scoring models” , Expert Systems with Applications, Elsevier Ltd, 38, 10, 13274–13283, 2011.

 

[12]      Oreski S., Oreski D., Oreski G., “Hybrid system with genetic algorithm and artificial neural networks and its application to retail credit risk assessment” , Expert Systems with Applications, Elsevier Ltd, 39, 16, 12605–12617, 2012.

 

[13]      Mandala I. G. N. N., Nawangpalupi C. B., Praktikto F. R., “Assessing Credit Risk: An Application of Data Mining in a Rural Bank” , Procedia Economics and Finance, The Authors, 4, Icsmed, 406–412, 2012.

 

[14]      Chen W., Xiang G., Liu Y., Wang K., “Credit risk Evaluation by hybrid data mining technique” , Systems Engineering Procedia, 3, 194–200, 2012.

 

[15]      Mohamad S. K., Tasir Z., “Educational Data Mining: A Review” , Procedia - Social and Behavioral Sciences, Elsevier B.V., 97, 320–324, 2013.

 

[16]      Bekhet H., Eletter S., “Credit risk assessment model for Jordanian commercial banks: Neural scoring approach” , Review of Development Finance, University of Cairo., 4, 20–28, 2014.

 

[17]      Florez-Lopez R., Ramon-Jeronimo J. M., “Enhancing accuracy and interpretability of ensemble strategies in credit risk assessment. A correlated-adjusted decision forest proposal” , Expert Systems with Applications, Elsevier, March, 2015.

 

[18]      Danenas P., Garsva G., “Selection of Support Vector Machines based classifiers for credit risk domain” , Expert Systems with Applications, Elsevier Ltd, 42, 6, 3194–3204, 2015.

 

[19]      Harris T., “Expert Systems with Applications Credit scoring using the clustered support vector machine” , Elsevier Ltd, 42, 741–750, 2015.