یک رویکرد ترکیبی جدید برای آموزش مدل ترکیب سلسله مراتبی شبکه های عصبی به منظور رتبه بندی اعتباری در صنعت بانکداری (بخش دوم)

متغیرهای مستقل

شامل آن دسته از متغیرهایی می شوند که بر ریسک اعتباری مشتری و به عبارتی دیگر بر متغیر وابسته مدل تاثیرگذارند. بنابراین با توجه به بررسی های انجام شده، مجموعه متغیرهایی که به نوعی می توانند بر متغیر وابسته مدل تاثیر گذارند به شرح زیر هستند:

سرمایه در گردش (بدهی های جاری – دارای های جاری)
نسبت بدهی جاری (بدهی های جاری به دارایی ها)
نسبت مالکانه (حقوق صاحبان سرمایه یا ارزش ویژه به جمع دارایی ها)
نسبت دارایی (دارایی جاری به کل دارایی ها)
نسبت سریع (آنی) (دارایی جاری منهای موجودی کالا به بدهی جاری)
نسبت گردش نقد (موجودی نقدی و سپرده ها به بدهی جاری)
موجودی نقد و سپرده ها به کل دارایی ها
نسبت جاری (دارایی جاری به بدهی جاری)
نسبت بدهی (کل بدهی ها به کل دارایی ها)
حاشیه سود (سود خالص به فروش)
بازده دارایی (سود خالص به کل دارایی ها)
سود انباشته به کل دارایی ها
نسبت بدهی به حقوق صاحبان سهام
کل وام هایی بانکی به کل دارایی ها
کل وام های بانکی به کل بدهی ها
فروش خالص به کل دارایی ها
موجودی کالا به فروش خالص
بدهی های جاری به فروش خالص

جمع آوری و پیش پردازش داده ها

داده های مربوط به مشتریان مختلف در طی سال های مختلف جمع آوری و در پایگاه داده ذخیره شدند. برای این منظور داده های مربوط به 108 مشتری حقوقی مختلف در طی بازه های زمانی معین جمع آوری شدند. همانطور که گفته شد، این داده ها مربوط به مشتریانی است که برای بانک از اهمیت بالاتری نسبت به سایر مشتریان برخوردارند.
کیفیت داده ها در پیش بینی همواره یک موضوع کلیدی است. برای این منظور و برای بهبود نتایج، پیش از این که داده ها برای آموزش و برای بهبود نتایج، پیش از این که داده ها برای آموزش شبکه ها به مدل ارائه شوند، پردازش هایی بر ری آن ها انجام می گیرد.
با توجه به اینکه داده ها دارای مقادیر خام و در دامنه های مختلف قرار دارند، برای معرفی به عنوان ورودی به شبکه عصبی، باید نرمال و تبدیل به دامنه مشخصی از اعداد بین صفر و یک یا منفی یک و یک شوند.

مدل ترکیب سلسله مراتبی شبکه های عصبی

مدل ترکیب سلسله مراتبی شبکه های عصبی یکی از شبکه های بسیار قدرتمند در حوزه مسائل دسته بندی است. استفاده از مفاهیم آماری و احتمالات در آموزش این نوع شبکه باعث افزیش کارایی و دقت هر چه بیشتر آن شده است. از آنجا که هدف اصلی مقاله حاضر، دسته بندی مشتریان بر اساس اعتبارات آنان است، با استفاده از این شبکه که دارای ساختار و آموزش ماژولار است، دسته بندی مشتریان صورت می گیرد.
شبکه های عصبی سنتی از جمله پرسپترون چند لایه در زمینه تخمین تابع موفق عمل کرده اند و در مسائل بسیاری از کلاس بندی الگو تا مهندسی کنترل بکار رفته اند. اما این در حالی است که بی شک کارهای ارزشمند بیشتری وجود دارد که باید در چنین ساختارهایی از جمله روش های بهبود آموزش انجام شود.
بطور ایده ال چنین ساختارهایی از نظر آماری با انگیزه خواهند بود و دارای پارامترهایی هستند که به آسانی تفسیر می شوند. آنها همچنین باعث می شوند سرعت آموزش افزایش یابد، زیرا الگوریتم کاهش گرادیان که در پس انتشار سنتی در شبکه پرسپترون چند لایه به کار می رود، به طور معمول برای حل مسائل دنیای واقعی در زمان واقعی بسیار کند است یک روند معمول در چنین کارهایی، کاربرد مدل های جداگانه برای تخمین قسمت های مختلف یک مساله است.
رویکرد کلی، تقسیم مساله به مجموعه ای از زیر مساله ها و تخصیص یک مجموعه از تخمین زننده های تابع یا خبرگان به هر زیر مساله است. رویکردهای متفاوت از روش های مختلف و از خروجی های خبرگان، برای تقسیم مساله به زیر مساله و محاسبه بهترین راه حل، استفاده می کنند.
ساختار HMNN شامل شبکه های عصبی انباشته و ماژولار، به طور سلسله مراتبی است. HMNN بر گایه مفهوم (تجزیه کن غلبه کن) بنا نهاده شده است. این ساختار یک درخت است که در آن شبکه های راه گاهی در نقاط غیر ترمینال درخت قرار دارند. این شبکه ها بردار ورودی x را دریافت می کنند و خروجی های اسکالر تولید می کنند که در هر نقطه در فضای ورودی کسری از واحد هستند.

مدل پیشنهادی

این مدل همان طور که گفته شد دارای ساختار ماژولار است و از شبکه های عصبی که در ادامه معرفی می شوند تشکیل می شود. به طور کلی ساختار ماژولار یا بر روی داده ها شکل می گیرد یا بر روی ویژگی های مجموعه داده، بدین معنا که در رویکرد، داده ها خرد می شوند و به ماژول های مختلف شبکه وارد می شوند و در رویکرد دیگر، ویژگی ها شکسته می شوند و به ماژول های مختلف معرفی می شوند.
در این مقاله رویکرد دوم برای ساخت شبکه ماژولار استفاده شده است. سه شبکه راه گاهی که وظیفه تجمیع خروجی های هر سطح را دارند، خطی تعمیم یافته و شبکه های خبره، شبکه های عصبی رو به جلو هستند. این شبکه ها به شرح ذیل می باشند:

شبکه عصبی MLP
شبکه عصبی RBF
شبکه عصبی LCNN
شبکه عصبی LVQ

نحوه قرار گرفتن شبکه های خبره در کنار یکدیگر براساس میزان قدرت و دقت آن ها در برخورد با مساله پیش رو است. این فرض باعث می شود که نوعی تعادل در خروجی ماژول های سمت چپ و راست برقرار شود. همه شبکه ها اعم از راه گاهی و خبره، به تعداد ویژگی ها، واخدهای ورودی دارند و تعداد خروجی در شبکه خبره، برابر تعداد کلاس ها است، در حالی که این رقم در شبکه های راه گاهی، به تعداد شبکه های خبره در هر ماژول است.
با مشخص شدن ساختار شبکه های خبره و راه گاهی، فرایند معرفی داده ها به شبکه آغاز می گردد. در این مدل، ویژگی های مجموعه داده مورد نظر، بر مبنای روش (تقسیم نرم) میان چهار شبکه خبره توزیع می شوند.
برای این منظور، همانطور که در شکل مشخص شده است، ابتدا توسط الگوریتم BPOS برای هر شبکه، فرایند کاهش ویژگی اجرا و ویژگی های به دست آمده، به HMNN معرفی می شوند. در واقع برای هر یک از ماژول ها الگوریتم گسسته بهینه سازی انبوه ذرات به طور جداگانه به کار گرفته می شود و مجموعه ویژگی ها متناسب با عملکرد الگوریتم بهینه سازی، میان شبکه ها تقسیم می شوند.

آموزش ترکیبی – گروهی شبکه

برای تمامی شبکه های راه گاهی و خبره یکسان است، اما خروجی های شبکه های راه گاهی به عنوان وزن های شبکه های خبره در نظر گرفته می شوند. در واقع وظیفه شبکه های راه گاهی، یادگیری ترکیب موزون مناسب شبکه های خبره برای هر بردار ورودی است. آموزش برای تمامی داده ها و بر اساس الگوریتم اعتبارسنجی ضربدری 5 بخشی انجام می شوند.
شبکه های خبره و راه گاهی بطور همزمان آموزش می بینند. روند آموزش بر اساس رویکردی ترکیبی انجام می گیرد بدین صورت که هر یک از شبکه های خبره بر اساس روش های مرسوم و مربوط به هر شبکه خبره، و شبکه های راه گاهی طبق الگوریتم آموزش برخط شبکه HMNN آموزش می بینند و در نهایت با تجمیع دو رویکرد آموزش، یادگیری مدل پیشنهادی انجام می گیرد و پارامترهای مربوط به هر شبکه به دست می آید.
در واقع شبکه های راه گاهی، همزمان با یادگیری هر یک از خبره ها، یاد می گیرند که به خبره چه وزنی اختصاص داده شود تا نرخ خطا کاهش پیدا کنند. تابع خطایی هم که در فرایند آموزش حداقل می گردد، تابع میانگین مربعات خطا است.

الگوریتم بهینه سازی انبوه ذرات

این الگوریتم که از نوع الگوریتم های تکاملی می باشد، در سال 1995 توسط کندل و ابرهارت مطرح شد و از رفتار هجومی و دسته جمعی حیوانات مانند پرندگان و ماهی ها، اقتباس شده است. عملکرد یک الگوریتم PSO به این صورت است که دسته ای از ذرات (به عنوان متغیرهای مسئله بهینه سازی) در محیط جستجو پخش می شوند.
واضح است که بعضی از ذرات، موقعیت بهتری نسبت به ذرات دیگر خواهند داشت. در نتیجه بر طبق رفتار ذرات هجومی بقیه ذرات سعی می کنند موقعیت خود را به موقعیت ذرات برتر برسانند، در عین حال که موقعیت ذرات برتر نیز در حال تغییر می باشد. در واقع هر ذره از برتری یا عدم برتری خود نسبت به ذرات همسایه و همچنین نسبت به کل گروه آگاه است به همین دلیل در صورتی که اشتباهی رخ دهد و تصمیم بدی گرفته شود، به زودی آن را جبران می کنند.
به این ترتیب ذرات می توانند به راحتی محدوده اطراف خود را جستجو کنند، بدون آنکه نگران خراب تر شدن نتیجه باشند.

الگوریتم گسسته بهینه سازی انبود ذرات

برای فضای جستجوی گسسته باینری، کندی و ابرهات PSO را به جستجو در فضای باینری با به کارگیری تبدیل سیگمویید برای سرعت ذرت به منظور تبدیل سرعت ها به بازه (0.1) و اجبار موقعیت های ذرات برای اختیار کردن مقادیر صفر و یک تطبیق داده اند.
در رشته انتخابی، بردار موقعیت های ذره توسط رشته ای از مقادیر باینری به طول n مشخص می شود که n تعداد کل ویژگی هاست. هر بردار یک زیرمجموعه از رشته را نشان می دهد. اگر مقدار بیت (مقادیر صفر و یک) یک باشد، به این معناست که رشته مربوطه انتخاب شده است، در غیر این صورت رشته مربوطه انتخاب نشده است.
هر ذره در جامعه موقعیت و سرعت خود را بر اساس روابط زیر به روزرسانی می کند.
لازم به ذکر است که پارامترهای روابط مذکور و سایر مراحل الگوریتمف شبیه آن چیزی است که در PSO پیوسته توضیح داده شد. تحلیل گران عموما مجموعه ای از متغیرهای مستقل پیشنهادی برای شرکت دادن در مدل دارند که احتمال زیاد شامل همه متغیرهای مهم است، اما مطمئن نیستند که همه این متغیرها به منظور مدل سازی مناسب، در مورد متغیر وابسته لازم باشند.
در چنین وضعیتی تمایل به غربال کردن متغیرهای پیشنهادی به منظور به دست آوردن مدلی دارین که بهترین زیر مجموعه از متغیرهای مستقل را در بر داشته باشد. روشی که در این مقاله از آن برای کاهش و انتخاب ویژگی ها استفاده شده، الگوریتم باینری بهینه سازی انبوه ذرات است.

اجرای مدل HMNN

پس از ساخت مدل، در این بخش، مدل مورد نظر بر روی مجموعه داده موجود اجرا و نتایج آن با مدل شبکه عصبی پرسپترون چند لایه و شبکه عصبی با اتصالات جانبی مقایسه می شود.
نتایج مدل ها براساس کارایی و دقت پیش بینی رتبه بندی می شوند و در نهایت مدل برتر انتخاب می گردد. با توجه به ماهیت ماژولار بودن مدل، ویژگی های منتخب برای هر ماژل شبکه عصبی در گام اول به دست می آید.
در گام بعدی و قبل از ارائه نتایج نهایی، احتمالات پیشین به دست آمده که در واقع میزان تاثیرگذاری هر یک از شبکه ها یا احتمال انتخاب و تاثیر آن ها در فرایند آموزش است و همچنین مقادیر احتمالات پسین که مهمترین پارامترهای یادگیری همگرایی شبکه هستند.

نتیجه گیری و تحقیقات آتی

در این مقاله مدلی جدید برای رتبه بندی اعتباری مشتریان بانک به کار گرفته شد. مدل پیشنهادی از یک طرف به دلیل کارایی بالا و از طرفی دیگر به دلیل نرخ خطای بسیار کم نسبت به سایر مدل های در این حوزه برجستگی در خور توجهی دارد.
برای بررسی کارایی مدل ها در تفکیک مشتریان به خوش حساب و بدحساب، از نمودار مقایسه نرخ خطای هر شبکه استفاده شد. علاوه بر این از تحلیل منحنی راک نیز سود برده شد. نتایج مبین این است که مدل شبکه عصبی HMNN نسبت به دو مدل دیگر در این حوزه کاراتر است.
این امر با توجه به حساسیت موضوع رتبه بندی مشتریان، برای بانک ها از اهمیت بسزایی برخوردار است چرا که اشتبها در این سیستم باعث بروز صدماتی جبران ناپذیر می شود که نه تنها می تواند اعتبار بانک را خدشه دار کند بلکه باعث سوء استفاده های مالی عظیمی در این مسیر می گردد.
بدیهی است مدل برتر و منتخب در این تحقیق به عنوان یک پیشنهاد دهنده به بانک عمل می کند و تصمیم نهایی برعهده مسئولین و ارزیابان بانک است.
در این مقاله توانستیم با اتخاذ رویکردهایی از جمله ترکیب شبکه ها، تغییر در ساختار و یادگیری آن ها و همچنین استفاده از الگوریتم های فرابتکاری، نتایج خوبی به دست آوریم که در بهترین حالت، مدل شبکه عصبی سلسله مراتبی توانست پیش بینی را با دقتی بیش از 95% بهمراه خطایی کمتر از 0.068 انجام دهد.
باتوجه به یافته های تحقیق که در بالا بیان شد، می توان نتیجه گرفت که رفتار اعتباری مشتریان تسهیلات از طریق مدل رتبه بندی اعتباری مشتریان قابل اجرا است. یعنی با کمک این روش می توان رفتار مشتریان را در قالب مشتریان خوش حساب و بدحساب رتبه بندی کرد، که این کار سبب کاهش ریسک اعتباری و باعث افزایش سودآوری برای بانک و جذب مشتریان خوب می شود.

یک رویکرد ترکیبی جدید برای آموزش مدل ترکیب سلسله مراتبی شبکه های عصبی به منظور رتبه بندی اعتباری در صنعت بانکداری
https://www.sid.ir/fa/journal/ViewPaper.aspx?ID=309729

كلمات كليدی: رتبه بندی اعتباری، امتیاز اعتباری، اعتبارسنجی، رتبه اعتباری، سامانه اعتبارسنجی