کاربرد شبکه هاي عصبي در رتبه بندي اعتباري فروش اقساطي متقاضيان وام (بخش دوم)

این پرسشنامه ها دارای شباهت قابل توجهی (پس از بومی سازی و مطابقت با شرایط ایران) با پرسشنامه پیشنهادی هنس هافمن می باشند همچنین اعتبار علمی این پرسشنامه ها و نقش تحلیلی و اهمیت متغیرهای مورد استفاده در توضیح وضعیت اعتباری در مقالات مختلف از جمع آوری و همکاران مورد بررسی قرار گرفته است و لذا به منظور حفظ اختصار از ذکر مجدد آن ها در این مقاله خودداری شده است.

کاربرد شبکه هاي عصبي در رتبه بندي اعتباري فروش اقساطي متقاضيان وام (بخش دوم)

معرفی داده ها و روش جمع آوری آن ها

از سوی دیگر، اغلب بانک ها در ایران به منظور ارزیابی اعتبار متقاضیان انواع وام، پرسشنامه هایی را تنظیم و در اختیار متقاضیان قرار می دهند. 
این پرسشنامه ها دارای شباهت قابل توجهی (پس از بومی سازی و مطابقت با شرایط ایران) با پرسشنامه پیشنهادی هنس هافمن می باشند همچنین اعتبار علمی این پرسشنامه ها و نقش تحلیلی و اهمیت متغیرهای مورد استفاده در توضیح وضعیت اعتباری در مقالات مختلف از جمع آوری و همکاران مورد بررسی قرار گرفته است و لذا به منظور حفظ اختصار از ذکر مجدد آن ها در این مقاله خودداری شده است. 
متغیرهای مورد استفاده در این مطالعه عبارتند از: وضعیت اعتباری، سن متقاضی، جنسیت و وضعیت تاهل، اموال و دارایی ها، شغل مشتری، مدت زمان اشتغال به کار، وضعیت مسکن، مدت زمان سکونت در آدرس فعلی، موجودی حساب جاری، میزان وام دریافتی، هدف از دریافت وام، میزان موجودی حساب پس انداز، سابقه اعتباری مشتری و مدت زمان ارتباط با بانک.
مبنای محاسبه مدت زمان ارتباط با بانک فاصله زمانی بین افتتاح حساب مشتری در بانک تا زمان دریافت وام از سوی مشتری می باشد. برخی از متغیرها به صورت کمی و برخی دیگر به صورت رسته ای استفاده شده اند. 
متغیر وضعیت اعتباری با دو سطح خوب و بد مشخص شده است. از میان دریافت کنندگان وام، افراد دارای بیش از سه قسط معوق به عنوان بد اعتبار و سایر مشتریان به عنوان خوش اعتبار طبقه بندی شده اند. 
بدیهی است تعدادی از این متغیرهای مستقل، پیش بینی کننده های خوبی درباره درباره وضعیت بازپرداختی مشتری نیستند و باید از مدل رتبه بندی کنار گذاشته شوند. 
باتوجه به دو حالتی متغیر پاسخ، برای انتخاب متغیرهای مستقل دارای رابطه معنی دار با وضعیت اعتباری متقاضیان، از رگرسیون لجستیک و روش انتخاب پس رو استفاده شده است. 
در هر مرحله از تحلیل رگرسیونی، اگر مقدار سطح معنی داری در آزمون ضریب متناظر با یک متغیر، از مقدار 0.1 بیشتر باشد، متغیر از مدل خارج می شود. 

روش های مورد استفاده برای ساختن مدل رتبه بندی

با توجه به اینکه هدف از رتبه بندی، تقسیم متقاضیان وام به دو گروه خوش اعتبار و بد اعتبار است، مسئله رتبه بندی با مسئله طبقه بندی ارتباط پیدا می کند. در واقع مدل های طبقه بندی به عنوان ابزاری برای تقسیم بندی متقاضیان وام استفاده می شوند. 
از آنجا که در این مقاله هدف اصلی، استفاده از مدل های شبکه عصبی در رتبه بندی اعتباری متقاضیان وام است، لذا مدل اصلی استفاده شده برای طبقه بندی، یک مدل شبکه عصبی پرسپترون چند لایه با الگوریتم یادگیری پس انتشار خطاست. در کنار این مدل، ما از دو مدل آماری دیگر (یعنی مدل های آنالیز ممیزی و رگرسیون لجستیک) نیز برای طبقه بندی متقاضیان استفاده و نتایج حاصل از سه مدل را با هم مقایسه می کنیم. 

روش اعتبارسنجی و استفاده از آن در طراحی مدل های رتبه بندی

روش استاندارد برای ارزیابی یک سیستم رتبه بندی اعتباری، استفاده از یک نمونه کنار گذاشته شده است. در واقع، برای ارزیابی عملکرد مدل، نمونه ای را  می خواهیم که از یک سوء مستقل از نمونه ای باشد که برای ساختن مدل رتبه بندی مورد استفاده قرار می گیرد و از سوی دیگر، بسیار شبیه به جامعه اصلی باشد. 
بدیهی است که داشتن چنین نمونه ای مستلزم در اختیار داشتن یک نمونه بزرگ از مشتریان است. از طرفی، خود این مسئله می تواند در مواردی موجب بروز مشکلاتی شود. 
به طور مثال در مواردی ممکن است که ما با یک محصول اعتباری جدید مواجه باشیم و یا در مورد یک نوع اعتبار خاص، جامعه موجود محدود باشد و دسترسی به اطلاعات تعداد زیادی از مشتریان، به آسانی میسر نباشد. 
در این گونه موارد، به دلیل محدود بودن اطلاعات در دسترس، ناچار به استفاده از تمام داده ها برای ساختن مدل اعتباری، می باشیم. بنابراین امکان کنار گذاشتن قسمتی از نمونه وجود نخواهد داشت. راه حل پیشنهاد شده برای این مشکل، استفاده از روش اعتبارسنجی است. 
در این روش، هربار یک زیرنمونه از نمونه اصلی انتخاب و کنار گذاشته می شود. این زیر نمونه برای ارزیابی عملکرد مدل برازش شده با استفاده از باقیمانده اعضای نمونه، به کار می رود. 
این فرایند برای زیر نمونه های مختلف تکرار می شود و میانگین نتایج حاصل از زیر نمونه های مختلف محاسبه می شود. دو روش برای انتخاب زیر نمونه ها پیشنهاد شده است. 
  • الف. بیرون گذاشتن یک مشاهده: در این روش، یک مشتری به عنوان مجموعه آزمایشی برای ارزیابی عملکرد مدلی به کار می رود که براساس n-1 مشتری دیگر ساخته شده است و این فرایند برای هر یک از مشتریان موجود در نمونه تکرار می شود. 
  • ب. روش چرخشی: نمونه به حجم  n، به m زیر نمونه مجزا تفکیک می شود و هر بار یک زیر نمونه برای آزمایش عملکرد مدلی که بر اساس زیر نمونه های باقی مانده ساخته شده، کنار گذاشته می شود. 
برای طراحی و بررسی دقت پیش بینی این مدل ها از یک نمونه 500 تایی متقاضیان استفاده شده است. برای کاهش اثر وابستگی داده ها و افزایش صحت برآوردهای حاصل، از یک روش اعتبارسنجی 5 بخشی استفاده کرده ایم، بدین صورت که نمونه 500 تایی، به 5 زیر نمونه 100 تایی دو به دو مجزا تقسیم می شود. 
هر یک از 5 زیر نمونه به عنوان یک زیر نمونه مستقل کنار گذاشته شده برای آزمایش عملکرد مدلی به کار می رود که بر اساس 4 زیرنمونه دیگر ساخته شده است. 
دقت طبقه بندی کلی به دست آمده، میانگین دقت طبقه بندی در بین 5 زیر نمونه است. از مزایای استفاده از این روش اعتبارسنجی، این است که از یک سو مدل رتبه بندی براساس یک نمونه نسبتا بزرگ از داده های موجود (هشتاد درصد) ساخته می شود و از سوی دیگر تمام داده ها برای ارزیابی عملکرد مدل استفاده می شوند. 

مدل شبکه عصبی

یک مدل شبکه عصبی شامل مجموعه ای از نرون هاست که در لایه های ورودی، میانی و خروجی جمع شده اند و البته چندین لایه میانی می تواند بین لایه ورودی و لایه خروجی قرار گیرد. 
یک مدل شبکه عصبی از متغیرهای ورودی در لایه اول استفاده می کند. خروجی شبکه معمولا راه حلی برای یک مسئله است. در این تحقیق خروجی شبکه می تواند نشان دهنده یک متقاضی خوب و یا متقاضی بد باشد. شبکه، مقادیر عددی برابر یک را به متقاضی خوب و مقدار صفر را به یک متقاضی بد اختصاص می دهد. 
برای محاسبه خروجی ها، مدل شبکه عصبی از وزت ها استفاده می کند. وزن ها به صورت عددی ارتباط بین دو نرون را نشان می دهند و بیانگر اهمیت نسبی هر متغیر ورودی هستند. 
در جریان اصلاح مکرر وزن ها، یک شبکه آموزش می بیند. فرایند یادگیری در یک شبکه عصبی، شامل محاسبه خروجی و اصلاح وزن هاست. با تکرار فرایند یادگیری، شبکه مقادیر صحیح وزن ها را شناسایی می کند. برای یک مجموعه مشخص از رودی ها، خطا عبارت است از تفاضل بین مقدار واقعی و خروجی شبکه. 
معیار خطایی که ما در این جا در نظر گرفته ایم میانگین مربعات خطاست. شبکه، وزن ها را به گونه ای تغییر می دهد که مقدار میانگین مربعات خطا حداقل شود. شبکه های عصبی مختلف، مقدار خطا را براساس الگوریتم های یادگیری که مورد استفاده قرار می دهند، محاسبه می کنند. 
از آن جا که الگوریتم یادگیری پس انتشار خطا توانایی شناسایی الگوها را در دامنه وسیعی از داده ها دارد، می تواند در امور مالی و در پیش بینی عملکرد سیستم های مالی، بررسی عملکرد سهام، رتبه بندی اعتباری و بررسی درخواست های وام و یا شناسایی مشتریان متقلب در مورد کارت های اعتباری استفاده شود. 
شبکه های عصبی دارای انواع مختلف هستند. در این میان شبکه های عصبی پیش خور از جمله شبکه های عصبی با کاربرد فراوان می باشند و به دلیل ارتباط نزدیک شبکه ها از چند لایه تشکیل شده اند.
هر نرون در هر لایه به تمامی نرون های لایه قبل متصل است. به چنین شبکه هایی، شبکه های کاملا مرتبط نیز می گویند. این شبکه ها از یک لایه خروجی و چند لایه میانی تشکیل شده اند. 
خروجی های لایه اول، بردار ورودی لایه دوم را تشکیل می دهند، و به همین ترتیب بردار خروجی لایه دوم، بردار دوم لایه سوم را می سازد و سرانجام خروجی های لایه آخر، پاسخ واقعی شبکه را تشکیل می دهند. به عبارتی روشن تر، روند جریان سیگنالی در شبکه، در یک مسیر پیشرو صورت می گیرد. 
هر لایه می تواند از تعدادی نرون های متفاوت با توابع مختلف برخوردار باشد. یک نمونه ساده از شبکه های عصبی پیشخور، شبکه عصبی پرسپترون است. این شبکه ها در زمره کاربردی ترین شبکه های عصبی هستند. این شبکه ها قادرند با انتخاب مناسب تعداد لایه و سلول های عصبی که اغلب هم زیاد نیست، یک نگاشت غیر خطی را با دقت دلخواه تقریب بزنند. 
شبکه عصبی مورد استفاده در این مقاله برای ارزیابی متقاضیان وام، یک شبکه عصبی پرسپترون چند لایه با قاعده یادگیری پس انتشار خطاست و دارای نمای کلی زیر است:
  1. لایه ورودی با 7 متغیر که عبارتند از: موجودی حساب جاری، مدت زمان ارتباط با بانک، مدت زمان اشتغال، دارایی ها، موجودی حساب پس انداز، سابقه اعتباری، جنسیت و وضعیت تاهل
  2. لایه میانی که در مورد تعداد لایه های میانی و تعداد نرون های مورد استفاده در هر یک از لایه های میانی صحبت خواهیم کرد. 
  3. لایه خروجی که یک مقدار عددی را به هر یک از مشتریان خوب و بد اختصاص می دهد

فرایند یادگیری و تعیین پارامترهای شبکه

برای بررسی عملکرد شبکه عصبی باید داده ها به طور تصادفی به دو گروه مجزا شامل مجموعه یادگیری و مجموعه آزمایشی تقسیم می شوند. 
برای این که یک مدل شبکه عصبی به خوبی آموزش ببیند، لازم است که برای یادگیری شبکه از نمونه ای استفاده کنیم که نماینده تمام جامعه تحت بررسی باشد. 
همان طور که در قسمت قبل اشاره کردیم، برای یادگیری شبکه از یک نمونه 400 تایی شامل متقاضیان خوب و بد استفاده می کنیم.
همچنن برای اینکه شبکه به طور موثر آموزش ببیند در کنار یک نمونه یادگیری خوب، تصمیم گیری در مورد ساختار شبکه عصبی و تعداد نرون ها در لایه های ورودی، خروجی و میانی ضروری است. 
تعداد نرون ها در لایه ورودی به سادگی برابر با تعداد متغیرها در مجموعه داده هایی است که ورودی شبکه را تشکیل می دهند. با توجه به هدف تحقیق که طبقه بندی متقاضیان به دو گروه است، یک نرون در لایه خروجی به کار گرفته می شود که دو کد مختلف را به متقاضیان خوب و بد اختصاص می دهد. 
همچنین شبکه دارای یک لایه میانی است که باید در مورد تعداد نرون ها در این لایه تصمیم گیری شود. گرچه قوانین تجربی زیادی وجود دارد که میتوان برای انتخاب تعداد نرون های لایه میانی از آن ها استفاده کرد، ولی در اغلب موارد، آزمون و خطا بهترین راه حل برای تعیین تعداد نرون هاست . 
علاوه بر داشتن تعداد مناسب از نرون های لایه میانی، شبکه عصبی باید به وسیله تعداد بهینه از سیکل های یادگیری، آموزش داده شود. چنانچه شبکه با تعداد دوره های کم آموزش داده شود، مشکل کم برآوردی و چنانچه با دوره های زیاد آموزش داده شود منجر به بیش برآوردی می شود. 
در نهایت شبکه طراحی شده برای متقاضیان وام، دارای یک لایه میانی با 7 نرون، لایه خروجی با 1 نرون و تابع و تعداد 100 دوره آموزشی است. 
تعداد لایه های میانی و تعداد دوره های آموزشی با استفاده از روش آزمون و خطا تعیین شده اند. همچنین 13 تابع یادگیری مختلف آزمایش شده اند که در نهایت تابعی که با استفاده از آن شبکه بهترین عملکرد و کمترین خطا را به دست آورده، انتخاب شده است. 

کاربرد شبکه های عصبی در رتبه بندی اعتباری فروش اقساطی متقاضيان وام
https://www.sid.ir/fa/journal/ViewPaper.aspx?ID=74663
 
كلمات كليدی: اعتبارسنجی، سامانه اعتبارسنجی، اعتبار بانکی افراد، اعتبار سنجی مشتریان، اعتبار سنجی چک، تعریف اعتبارسنجی


نظر شما
نام
پست الكترونيک
وب سایت
متنی که در تصویر می بینید عینا تایپ نمایید
نظر
مقالات بیشتر
مقالات مرتبط
.
.
2019© کلیه حقوق مادی و معنوی این سایت متعلق به شرکت توسعه زیر ساخت های فناوری اطلاعات سیگما میباشد.